речь идет о непараметрической оценке плотности.
Итак, у нас есть 2 разных данных 220 значений «хороших данных» и 30 значений «неверных данных», мы должны использовать оценку плотности k-ближайших соседей для оценки p (x | c = «хорошие данные»)
В случае k=5 имеем p(x |c=хорошо) =(5/220)*(1/V).
Если я правильно понял, по k-ближайшему соседу мы должны определить V и затем получить p(x |c=хорошо). Если мы должны найти V для 5 баллов, то мы можем решить p(x|c=хорошо)
У меня проблема, как построить и вычислить эту вероятность. Есть картинка из книги http://content.foto.mail.ru/mail/zurix/_mypagephoto/h-67.jpg Что означает синяя кривая на графике оценки плотности ближайшего соседа K (см. вложение)? Может ли эта кривая показать границы разных V? Если да, то где именно граница между классами, каждый класс состоит из 5 точек???
Заранее спасибо!!