Вопросы по теме 'sklearn-pandas'
Оптимизация DBSCAN для вычислительной работы
Я использую алгоритм DBSCAN в Python для набора данных (смоделирован очень похоже на http://scikit-learn.org/stable/auto_examples/cluster/plot_dbscan.html и загружается как кадр данных pandas), который содержит в общей сложности около 3 миллионов...
1137 просмотров
schedule
09.08.2023
Получение ошибки значения при использовании OneHotEncoder и данных подгонки
Я работаю над заданием, и мы используем OneHotEncoder в scikit-learn, чтобы распечатать все категории. Вот образец данных и код, который я использовал для их преобразования:
grade sub_grade short_emp emp_length_num home_ownership...
605 просмотров
schedule
06.02.2024
Функциональные столбцы Python
Я борюсь с чем-то, вероятно, простым в python/pandas...
У меня есть dataFrame с датами в столбцах, именами фруктов в индексе и ценами внутри.
Я ищу функцию, которая при вводе даты дает мне цены на фрукты на эту дату.
[in] mylist
[out]...
384 просмотров
schedule
10.01.2024
Назначение пользовательских категорий для данных json - pandas
Назначение меток необработанным данным вместо получения новых столбцов индикатора из get_dummies. Я хочу что-то вроде этого:
json_input:
[{id: 100, vehicle_type: "Автомобиль", время: "2017-04-06 01:39:43", zone = "A", type: "Checked"}, {id:...
106 просмотров
schedule
23.08.2023
образец X примеров из каждой метки класса
У меня есть набор данных (вектор numpy) с 50 classes и 9000 обучающих примеров.
x_train=(9000,2048)
y_train=(9000,) # Classes are strings
classes=list(set(y_train))
Я хотел бы создать поднабор данных таким образом, чтобы каждый класс имел...
3899 просмотров
schedule
22.11.2023
Как я могу проверить значения функций для прогнозируемого значения в sklearn
Я делаю двоичную классификацию, прогнозируемые значения равны 0 и 1, есть ли способ получить значения функций для значения прогноза.
например: у меня есть 2 функции «Возраст» и «Зарплата», а целевое значение «покупается». Возраст Зарплата Покупка...
279 просмотров
schedule
15.08.2022
SVM: Модель, созданная с нуля, после обучения
Как я могу сгенерировать свою модель после обучения? Я не использовал пакет sklearn для моей пригодности и предсказания. Мой код выглядит так:
class SVM(object):
def __init__(self, kernel=polynomial_kernel, C=None):
self.kernel = kernel...
229 просмотров
schedule
16.08.2023
Каков наиболее эффективный способ применить многопроцессорность к уникальным категориям записей в кадре данных pandas?
У меня есть большой набор данных (tsv), который выглядит примерно так:
category lat lon
apple 34.578967 120.232453
apple 34.234646 120.535667
pear 32.564566 120.453567
peach 33.564567...
307 просмотров
schedule
19.04.2024
R^2 отрицательный при использовании sklearn и 0,92 при использовании статистических моделей
Я так растерялся. Я сравниваю лассо и линейную регрессию на модели, предсказывающей цены на жилье. Я не понимаю, как, когда я запускаю линейную модель в sklearn, я получаю отрицательный результат для R ^ 2, но когда я запускаю ее в лассо, я получаю...
465 просмотров
schedule
08.05.2024
Как использовать пользовательскую функцию подсчета очков в sklearn cross_val_score
Я хочу использовать Скорректированный Rsquare в функции cross_val_score . Я пытался использовать функцию make_scorer , но она не работает.
from sklearn.cross_validation import train_test_split
X_tr, X_test, y_tr, y_test = train_test_split(X,...
3603 просмотров
schedule
28.08.2023
Панды - Соотношение между строками
Мне нужно узнать долю элементов столбца относительно определенного значения в этом столбце . Например, в этой таблице A я хочу узнать отношение столбца Metric к значению, где { id1=x и id2=z } этого столбца. Кто-нибудь может мне помочь,...
1851 просмотров
schedule
29.11.2022
Чтение нескольких CSV-файлов в Pandas по частям
Как импортировать и читать несколько CSV-файлов по частям, когда у нас есть несколько CSV-файлов, а общий размер всех CSV-файлов составляет около 20 ГБ?
Я не хочу использовать Spark , так как хочу использовать модель в SkLearn, поэтому мне нужно...
4066 просмотров
schedule
06.01.2024
Загрузка набора данных SKLearn 20_newsgroups в Pandas DataFrame
Python : я пытаюсь загрузить набор данных sklearn.20_newsgroups sklearn.utils.Bunch в кадр данных pandas .
Я скачал наборы данных по ссылке ниже
categories = ["alt.atheism", "alt.atheism" ,"comp.os.ms-windows.misc" ,...
1043 просмотров
schedule
25.02.2024
Почему мои точки данных не находятся в своих правильных точных кластерах при использовании кластеризации K-средних?
Я построил некоторые точки данных, используя кластеризацию K-средних. Скриншот доступен по адресу « https://imageshack.com/i/pomMJXMkj . Когда я визуализирую эти точки данных, ясно видно, что многие точки не находятся в своих соответствующих...
157 просмотров
schedule
13.03.2023
Структура данных для кластеризации KMeans с использованием Pandas DataFrames
В настоящее время я работаю над некоторыми научными данными и пытаюсь выполнить задачу кластеризации, но получаю ошибку значения из-за формата данных. Это два Pandas DataFrames в [170 строк x 7 столбцов].
Я пробовал переносить данные,...
70 просмотров
schedule
23.07.2022
Внесение пропущенных значений с использованием класса sklearn IterativeImputer для MICE
Я пытаюсь узнать, как реализовать MICE для вменения пропущенных значений для моих наборов данных. Я слышал о MICE от fancyimpute, но я также читал, что класс IterativeImputer sklearn может давать аналогичные результаты. Из документации sklearn:...
2084 просмотров
schedule
28.06.2023
Функция обратного преобразования не возвращает правильное значение
Я следую руководству по мультимаркировке жанров фильмов из https://www.analyticsvidhya.com/blog/2019/04/predicting-movie-genres-nlp-multi-label-classification/
Я использую этот учебник для создания тега прогнозирования для регистрации жалоб. В...
558 просмотров
schedule
12.02.2024
Невозможно импортировать SMOTE из-за ошибки ‹< ImportError: невозможно импортировать имя 'lobpcg' из 'sklearn.utils.fixes' ››
Невозможно импортировать SMOTE из-за ошибки ImportError: невозможно импортировать имя 'lobpcg' из 'sklearn.utils.fixes' (E: \ Installations \ lib \ site-packages \ sklearn \ utils \ fixes.py)
Выше ошибка отображается, когда я пытаюсь...
2854 просмотров
schedule
04.07.2023
Временная дезагрегация временных рядов в Python
Я пытаюсь найти пакет, который обеспечивает временную дезагрегацию временных рядов. В R есть пакет под названием tempdisagg.
https://journal.r-project.org/archive/2013/RJ-2013-028/RJ-2013-028.pdf
Есть ли какой-нибудь аналогичный пакет в...
845 просмотров
schedule
03.12.2023
Использование OneHotEncoder для создания фиктивных переменных
Я пытаюсь создать фиктивные переменные в своем наборе ввода следующего вида: Мой набор ввода
Итак, я закодировал категориальные данные, поэтому теперь мой массив имеет вид: Закодированный входной набор
Далее я хотел бы создать фиктивные...
259 просмотров
schedule
29.10.2023