K-mean кластеризация, почему разные начальные положения кластеров влияют на конечный результат кластеризации?

Я не уверен, подходит ли этот вопрос здесь. Во всяком случае, кажется, что люди здесь полезны. Вот мой вопрос.

В случае кластеризации k-mean необходимо указать начальные позиции кластеров. почему разные начальные положения кластеров влияют на конечный результат кластеризации?


person John    schedule 02.02.2011    source источник
comment
Мы также знаем подробные мелочи о The Princess Bride, The Wire, оптимальных стратегиях для Scrabble и неоптимальных стратегиях подбора женщин, но это не значит, что такие вопросы здесь уместны.   -  person jason    schedule 03.02.2011
comment
@Jason: извините, что разместил здесь такой неуместный вопрос. Не мог бы админ удалить его для меня. Спасибо!   -  person John    schedule 03.02.2011
comment
Эх, не нужно сожалеть; это интересный вопрос. Я просто пытался пошутить. Я часто терплю неудачу в этом.   -  person jason    schedule 03.02.2011
comment
@ Джейсон: Хорошо. Может быть, я не понял вашу шутку из-за моего английского.   -  person John    schedule 03.02.2011


Ответы (1)


Когда вы используете k-средних, проблема, которую вы действительно хотите решить, состоит в том, чтобы минимизировать внутрикластерную сумму квадратов (WCSS). Не существует эффективного способа точного решения этой задачи (даже для двумерных точек). С более технической точки зрения, WCSS — это NP-сложная задача.

k-means - это итерационный метод, который находит приближенное решение проблемы WCSS, эта общая схема, которую использует k-means, представляет собой метод максимизации ожидания. Для большинства итерационных методов требуется начальная точка, и в целом качество решения будет зависеть от начальной точки.

person carlosdc    schedule 02.02.2011