Я построил модель классификатора, используя KNN в качестве обучающих элементов для ансамбля на основе метода случайного подпространства.
У меня есть три предиктора, размерность которых составляет 541 отсчет, и я разрабатываю процедуру оптимизации, чтобы найти наилучшее k (количество соседей). Я выбрал k, которые максимизируют AUC классификатора, производительность которого вычисляется с 10-кратной перекрестной проверкой. Результат для лучшего k составил 269 для каждого слабого ученика (то есть 60 в результате аналогичной оптимизации).
Теперь мой вопрос: 269 соседей — это слишком много? Я доверяю результатам оптимизации, но никогда не использовал столько соседей и беспокоюсь о переобучении.
Заранее спасибо, депутат