Вопросы по теме 'grid-search'

ошибка в GridsearchCV sklearn
Я пытаюсь настроить классификатор ГБ в sklearn, используя GridsearchCV. Вот код: from sklearn.grid_search import GridSearchCV from sklearn.ensemble import GradientBoostingClassifier param_grid = {'learning_rate': [0.1, 0.01, 0.001],...
6383 просмотров

Sklearn GridSearchCV, class_weight не работает по неизвестной причине :(
Пытаюсь запустить class_weight . Я знаю, что остальная часть кода работает, только class_weight выдает ошибку: parameters_to_tune = ['min_samples_split':[2,4,6,10,15,25], 'min_samples_leaf':[1,2,4,10],'max_depth':[None,4,10,15],...
8443 просмотров
schedule 19.07.2023

TypeError: если оценка не указана, переданная оценка должна иметь метод «оценка» при использовании CountVectorizer в GridSearch.
Я практикуюсь с текстом, используя scikit-learn. Чтобы лучше познакомиться с GridSearch, я начну с примера кода, который можно найти здесь : ############################################################################### # define a pipeline...
6777 просмотров
schedule 20.12.2022

Почему GridSearchCV не дает C с самым высоким AUC при оценке roc_auc в логистической регрессии
Я новичок в этом, поэтому извиняюсь, если это очевидно. lr = LogisticRegression(penalty = 'l1') parameters = {'C': [0.001, 0.01, 0.1, 1, 10, 100, 1000]} clf = GridSearchCV(lr, parameters, scoring='roc_auc', cv = 5) clf.fit(X, Y) print clf.score(X,...
1011 просмотров

python scikit изучает настройку гиперпараметров с помощью обучения вне ядра
в настоящее время я использую clf = SGDClassifier(loss='log', random_state=1, n_iter=1) для моего обучения модели прогнозирования. Тем не менее, данные для обучения довольно велики, поэтому я использую нестандартное обучение....
269 просмотров

используя лучшие параметры из gridsearchcv
Не знаю, уместно ли здесь задавать вопрос, но все же спрошу. Если это не разрешено, пожалуйста, дайте мне знать. Я использовал GridSearchCV для настройки параметров, чтобы добиться максимальной точности. Вот что я сделал: from...
16999 просмотров
schedule 04.11.2022

Found ValueError: только один класс присутствует в y_true, но переменная Y имеет оба двоичных значения
Я пытаюсь запустить ROC auc, код такой: actuals = gs.predict(feature_set) probas = gs.predict_proba(feature_set) plt.plot(roc_curve(data[['Won_YES']], probas[:,1])[0], roc_curve(data[['Won_YES']], probas[:,1])[1])...
1691 просмотров
schedule 03.10.2023

Оценщики стека/ансамбля с использованием SKlearn Pipeline и GridSearchCV
Изучая использование конвейеров и GridSearchCV, я попытался объединить регрессор случайного леса с регрессором опорных векторов. По отдельности GridSearchCV поставил оба примерно на 90%, где я сильно застрял. Но поставив SVR перед случайным лесом в...
2443 просмотров

Перекрестная проверка с поиском по сетке дает худшие результаты, чем по умолчанию
Я использую scikitlearn в Python для запуска некоторых базовых моделей машинного обучения. Используя встроенную функцию GridSearchCV (), я определил «лучшие» параметры для различных методов, но многие из них работают хуже, чем значения по умолчанию....
5452 просмотров

Python - LightGBM с GridSearchCV, работает вечно
Недавно я провожу несколько экспериментов по сравнению Python XgBoost и LightGBM. Кажется, что этот LightGBM - это новый алгоритм, который, как говорят, работает лучше, чем XGBoost, как по скорости, так и по точности. Это LightGBM GitHub . Это...
9034 просмотров

Как получить прогнозы для каждого набора параметров с помощью GridSearchCV?
Я пытаюсь найти лучшие параметры для модели регрессии NN с помощью GridSearchCV со следующим кодом: param_grid = dict(optimizer=optimizer, epochs=epochs, batch_size=batches, init=init grid = GridSearchCV(estimator=model, param_grid=param_grid,...
2337 просмотров

GridSearchCV в модели XGBoost выдает ошибку
Я сделал классификатор XGBoost на Python. Я попытался сделать GridSearch , чтобы найти такие оптимальные параметры, как этот grid_search = GridSearchCV(model, param_grid, scoring="neg_log_loss", n_jobs=-1, cv=kfold) grid_result =...
1896 просмотров

Инициализация SparkContext внутри другого объекта SparkContext
Я использую PySpark для распространения операции машинного обучения, состоящей из следующих шагов: Чтение данных Разделите данные на основе столбца (~ 100 столбцов, разделив один столбец с 50 уникальными значениями, поэтому необходимо...
555 просмотров
schedule 20.02.2024

Прогноз X конвейера имеет другую форму, чем во время подгонки
Я застрял с этой ошибкой, я понимаю ее значение, но не знаю, как с ней бороться. Вот что я делаю: class PreProcessing(BaseEstimator, TransformerMixin): def __init__(self): pass def transform(self, df): #Here i select the features...
1015 просмотров

scikit изучает перекрестную проверку сетки, возвращая неверное среднее значение
Я использовал GridCV для перекрестной проверки по k сгибам, чтобы настроить мои гиперпараметры. Средние результаты, которые должны были быть средними по отдельным сгибам, неверны в моем атрибуте результатов «cv_results_». Ниже приведен мой код для...
193 просмотров
schedule 25.07.2023

Запись лучших классификаторов GridSearch в таблицу
Я нашел и успешно протестировал следующий скрипт, который применяет Pipeline и GridSearchCV к выбору классификатора. Скрипт выводит лучший классификатор и его точность. import numpy as np from sklearn import datasets from sklearn.linear_model...
902 просмотров
schedule 31.05.2022

Поиск по сетке с регрессией LightGBM
Я хочу обучить регрессионную модель с помощью Light GBM, и следующий код отлично работает: import lightgbm as lgb d_train = lgb.Dataset(X_train, label=y_train) params = {} params['learning_rate'] = 0.1 params['boosting_type'] = 'gbdt'...
5931 просмотров
schedule 11.10.2023

Примерка sklearn GridSearchCV модель
Я пытаюсь решить проблему регрессии в Boston Dataset с помощью регрессор случайного леса . Я использовал GridSearchCV для выбора лучших гиперпараметров. Проблема 1 Должен ли я установить GridSearchCV на какой-нибудь X_train, y_train ,...
2899 просмотров

Замораживание GridSearchCV с помощью линейного svm
У меня проблема с зависанием GridSearchCV (процессор активен, но программа не продвигается) с линейным svm (но с rbf svm он работает нормально). В зависимости от random_state, которое я использую для разделения своих данных, у меня есть это...
93 просмотров

Поиск по сетке и KerasClassifier с использованием весов классов
Я пытаюсь выполнить поиск по сетке, используя функцию scikit-learn RandomizedSearchCV с оболочкой Keras KerasClassifier для моей несбалансированной проблемы классификации нескольких классов. Однако, когда я пытаюсь ввести class_weight в...
2181 просмотров
schedule 14.01.2024