Замораживание GridSearchCV с помощью линейного svm

У меня проблема с зависанием GridSearchCV (процессор активен, но программа не продвигается) с линейным svm (но с rbf svm он работает нормально).
В зависимости от random_state, которое я использую для разделения своих данных, у меня есть это зависание в разных точках разделения cv для разных компонентов PCA?
Характеристики одного образца выглядят следующим образом (около 39 признаков)

[1 117 137 2 80 16 2 39 228 88 5 6 0 10 13 6 22 23 1 227 246 7 1.656934307 0 5 0.434195726 0.010123735 0.55568054 5 275 119.48398 0.9359527 0.80484825 3.1272728 98 334 526 0.13454546 0.10181818]

Характеристики другого образца:

[23149 4 31839 9 219 117 23 5 31897 12389 108 2 0 33 23 0 0 18 0 0 0 23149 0 0 74 0.996405221 0.003549844 4.49347E-05 74 5144 6.4480677 0.286384 0.9947901 3.833787 20 5135 14586 0.0060264384 0.011664075]

Если я удалю последние 10 функций, у меня не будет этой проблемы (10 новых функций, которые я добавил до того, как мой код работал нормально). Я не проверял другие комбинации 10 последних новых функций, чтобы проверить, вызывает ли эта проблема конкретная функция.
Также я использую StandardScaler для масштабирования функций, но все еще сталкиваюсь с этой проблемой. У меня меньше этой проблемы, если я использую MinMaxScaler скейлер (но читал где-то, что это не хорошо для svm).
Я также ставил n_jobs на разные числа, и он мог только немного продвинуться, но снова зависает.
Что вы делаете. предложить?

Я следовал части этого кода, чтобы написать свой код: поиск сетки TypeError


person april    schedule 03.12.2018    source источник
comment
Вы смотрели на потребление оперативной памяти? может он начал подкачиваться   -  person Alessandro    schedule 03.12.2018
comment
Я проверил, но не вижу там проблемы.   -  person april    schedule 03.12.2018
comment
Вы можете добавить некоторые данные и код? Я хочу воспроизвести это.   -  person seralouk    schedule 04.12.2018