Запустите KMeans с фиксированным начальным числом

Я хочу запустить алгоритм KMeans MLLIB (Apache Spark), но с воспроизводимыми результатами.

Можно ли запустить KMeans MLLIB (Apache Spark) с фиксированным начальным числом? Как?

Спасибо и привет,


person learning_spark    schedule 21.12.2014    source источник
comment
Я использовал только ELKI, у него параметр kmeans.seed и он очень быстрый.   -  person Has QUIT--Anony-Mousse    schedule 25.12.2014
comment
Большое спасибо, Anony-Mousse. Однако в этом случае я вынужден использовать алгоритм только из Apache Spark :(   -  person learning_spark    schedule 27.12.2014


Ответы (2)


Что касается Spark 1.2, кажется, что это невозможно. Он генерирует семя внутри.

person Sean Owen    schedule 23.12.2014
comment
Большое спасибо, Шон. Я был под таким же впечатлением. - person learning_spark; 27.12.2014

Начальное значение для KMeans доступно в Spark MLLib, начиная с версии 1.4.0. См. библиотеку документов здесь

person m.piunti    schedule 21.02.2016