Как получить прогнозы для каждого набора параметров с помощью GridSearchCV?

Я пытаюсь найти лучшие параметры для модели регрессии NN с помощью GridSearchCV со следующим кодом:

param_grid = dict(optimizer=optimizer, epochs=epochs, batch_size=batches, init=init
grid = GridSearchCV(estimator=model, param_grid=param_grid, scoring='neg_mean_squared_error')
grid_result = grid.fit(input_train, target_train)

pred = grid.predict(input_test)

Насколько я понимаю, grid.predict(input_test) использует лучшие параметры для прогнозирования заданного набора входных данных. Есть ли способ оценить GridSearchCV для каждого набора параметров с помощью набора тестов?

На самом деле, в моем тестовом наборе есть несколько специальных записей, и я хочу проверить универсальность модели вместе с точностью. Спасибо.


person saleh    schedule 06.10.2017    source источник


Ответы (1)


Вы можете заменить стандартный трехкратный параметр cv для GridSearchCV настраиваемым итератором, который дает индексы обучения и тестирования объединенных кадров данных и тестовых данных. В результате при однократной перекрестной проверке вы тренируете свою модель на input_train объектах и ​​тестируете подобранную модель на input_test объектах:

def modified_cv(input_train_len, input_test_len):
    yield (np.array(range(input_train_len)), 
           np.array(range(input_train_len, input_train_len + input_test_len)))

input_train_len = len(input_train)
input_test_len = len(input_test)
data = np.concatenate((input_train, input_test), axis=0)
target = np.concatenate((target_train, target_test), axis=0)
grid = GridSearchCV(estimator=model, 
                    param_grid=param_grid,
                    cv=modified_cv(input_train_len, input_test_len), 
                    scoring='neg_mean_squared_error')
grid_result = grid.fit(data, target)

Получив доступ к grid_result.cv_results_ словарю, вы увидите значение своей метрики в тестовом наборе для всей сетки указанных параметров модели.

person Eduard Ilyasov    schedule 06.10.2017