Я построил модель сегментации, используя кластеризацию k-средних.
Кто-нибудь может описать процесс присвоения новых данных этим сегментам?
В настоящее время я применяю те же преобразования/стандартизации/выбросы, что и для построения модели, а затем вычисляю евклидово расстояние. Минимальное расстояние — это отрезок, в который попадает запись.
Но я вижу, что большинство попадают в один конкретный сегмент, и мне интересно, не пропустил ли я что-то по пути?
Спасибо