Вопросы по теме 'sklearn-pandas'

Оптимизация DBSCAN для вычислительной работы
Я использую алгоритм DBSCAN в Python для набора данных (смоделирован очень похоже на http://scikit-learn.org/stable/auto_examples/cluster/plot_dbscan.html и загружается как кадр данных pandas), который содержит в общей сложности около 3 миллионов...
1137 просмотров

Получение ошибки значения при использовании OneHotEncoder и данных подгонки
Я работаю над заданием, и мы используем OneHotEncoder в scikit-learn, чтобы распечатать все категории. Вот образец данных и код, который я использовал для их преобразования: grade sub_grade short_emp emp_length_num home_ownership...
605 просмотров
schedule 06.02.2024

Функциональные столбцы Python
Я борюсь с чем-то, вероятно, простым в python/pandas... У меня есть dataFrame с датами в столбцах, именами фруктов в индексе и ценами внутри. Я ищу функцию, которая при вводе даты дает мне цены на фрукты на эту дату. [in] mylist [out]...
384 просмотров

Назначение пользовательских категорий для данных json - pandas
Назначение меток необработанным данным вместо получения новых столбцов индикатора из get_dummies. Я хочу что-то вроде этого: json_input: [{id: 100, vehicle_type: "Автомобиль", время: "2017-04-06 01:39:43", zone = "A", type: "Checked"}, {id:...
106 просмотров

образец X примеров из каждой метки класса
У меня есть набор данных (вектор numpy) с 50 classes и 9000 обучающих примеров. x_train=(9000,2048) y_train=(9000,) # Classes are strings classes=list(set(y_train)) Я хотел бы создать поднабор данных таким образом, чтобы каждый класс имел...
3899 просмотров

Как я могу проверить значения функций для прогнозируемого значения в sklearn
Я делаю двоичную классификацию, прогнозируемые значения равны 0 и 1, есть ли способ получить значения функций для значения прогноза. например: у меня есть 2 функции «Возраст» и «Зарплата», а целевое значение «покупается». Возраст Зарплата Покупка...
279 просмотров

SVM: Модель, созданная с нуля, после обучения
Как я могу сгенерировать свою модель после обучения? Я не использовал пакет sklearn для моей пригодности и предсказания. Мой код выглядит так: class SVM(object): def __init__(self, kernel=polynomial_kernel, C=None): self.kernel = kernel...
229 просмотров

Каков наиболее эффективный способ применить многопроцессорность к уникальным категориям записей в кадре данных pandas?
У меня есть большой набор данных (tsv), который выглядит примерно так: category lat lon apple 34.578967 120.232453 apple 34.234646 120.535667 pear 32.564566 120.453567 peach 33.564567...
307 просмотров

R^2 отрицательный при использовании sklearn и 0,92 при использовании статистических моделей
Я так растерялся. Я сравниваю лассо и линейную регрессию на модели, предсказывающей цены на жилье. Я не понимаю, как, когда я запускаю линейную модель в sklearn, я получаю отрицательный результат для R ^ 2, но когда я запускаю ее в лассо, я получаю...
465 просмотров

Как использовать пользовательскую функцию подсчета очков в sklearn cross_val_score
Я хочу использовать Скорректированный Rsquare в функции cross_val_score . Я пытался использовать функцию make_scorer , но она не работает. from sklearn.cross_validation import train_test_split X_tr, X_test, y_tr, y_test = train_test_split(X,...
3603 просмотров

Панды - Соотношение между строками
Мне нужно узнать долю элементов столбца относительно определенного значения в этом столбце . Например, в этой таблице A я хочу узнать отношение столбца Metric к значению, где { id1=x и id2=z } этого столбца. Кто-нибудь может мне помочь,...
1851 просмотров

Чтение нескольких CSV-файлов в Pandas по частям
Как импортировать и читать несколько CSV-файлов по частям, когда у нас есть несколько CSV-файлов, а общий размер всех CSV-файлов составляет около 20 ГБ? Я не хочу использовать Spark , так как хочу использовать модель в SkLearn, поэтому мне нужно...
4066 просмотров

Загрузка набора данных SKLearn 20_newsgroups в Pandas DataFrame
Python : я пытаюсь загрузить набор данных sklearn.20_newsgroups sklearn.utils.Bunch в кадр данных pandas . Я скачал наборы данных по ссылке ниже categories = ["alt.atheism", "alt.atheism" ,"comp.os.ms-windows.misc" ,...
1043 просмотров

Почему мои точки данных не находятся в своих правильных точных кластерах при использовании кластеризации K-средних?
Я построил некоторые точки данных, используя кластеризацию K-средних. Скриншот доступен по адресу « https://imageshack.com/i/pomMJXMkj . Когда я визуализирую эти точки данных, ясно видно, что многие точки не находятся в своих соответствующих...
157 просмотров

Структура данных для кластеризации KMeans с использованием Pandas DataFrames
В настоящее время я работаю над некоторыми научными данными и пытаюсь выполнить задачу кластеризации, но получаю ошибку значения из-за формата данных. Это два Pandas DataFrames в [170 строк x 7 столбцов]. Я пробовал переносить данные,...
70 просмотров
schedule 23.07.2022

Внесение пропущенных значений с использованием класса sklearn IterativeImputer для MICE
Я пытаюсь узнать, как реализовать MICE для вменения пропущенных значений для моих наборов данных. Я слышал о MICE от fancyimpute, но я также читал, что класс IterativeImputer sklearn может давать аналогичные результаты. Из документации sklearn:...
2084 просмотров

Функция обратного преобразования не возвращает правильное значение
Я следую руководству по мультимаркировке жанров фильмов из https://www.analyticsvidhya.com/blog/2019/04/predicting-movie-genres-nlp-multi-label-classification/ Я использую этот учебник для создания тега прогнозирования для регистрации жалоб. В...
558 просмотров

Невозможно импортировать SMOTE из-за ошибки ‹< ImportError: невозможно импортировать имя 'lobpcg' из 'sklearn.utils.fixes' ››
Невозможно импортировать SMOTE из-за ошибки ImportError: невозможно импортировать имя 'lobpcg' из 'sklearn.utils.fixes' (E: \ Installations \ lib \ site-packages \ sklearn \ utils \ fixes.py) Выше ошибка отображается, когда я пытаюсь...
2854 просмотров

Временная дезагрегация временных рядов в Python
Я пытаюсь найти пакет, который обеспечивает временную дезагрегацию временных рядов. В R есть пакет под названием tempdisagg. https://journal.r-project.org/archive/2013/RJ-2013-028/RJ-2013-028.pdf Есть ли какой-нибудь аналогичный пакет в...
845 просмотров

Использование OneHotEncoder для создания фиктивных переменных
Я пытаюсь создать фиктивные переменные в своем наборе ввода следующего вида: Мой набор ввода Итак, я закодировал категориальные данные, поэтому теперь мой массив имеет вид: Закодированный входной набор Далее я хотел бы создать фиктивные...
259 просмотров