Я выполняю некоторые задачи машинного обучения, используя SVM. Я подозреваю, что данные нелинейны, поэтому я также включил ядро RBF. Я обнаружил, что SVM с ядром RBF НАМНОГО хуже, чем линейный SVM. Интересно, сделал ли я что-то не так со спецификациями параметров моего классификатора.
Мой код выглядит следующим образом:
from sklearn.svm import LinearSVC
from sklearn.svm import SVC
svm1 = LinearSVC() # performs the best, similar to logistic regression results which is expected
svm2 = LinearSVC(class_weight="auto") # performs somewhat worse than svm1
svm3 = SVC(kernel='rbf', random_state=0, C=1.0, cache_size=4000, class_weight='balanced') # performs way worse than svm1; takes the longest processing time
svm4 = SVC(kernel='rbf', random_state=0, C=1.0, cache_size=4000) # this is the WORST of all, the classifier simply picks the majority class