Я хочу запустить алгоритм KMeans MLLIB (Apache Spark), но с воспроизводимыми результатами.
Можно ли запустить KMeans MLLIB (Apache Spark) с фиксированным начальным числом? Как?
Спасибо и привет,
Я хочу запустить алгоритм KMeans MLLIB (Apache Spark), но с воспроизводимыми результатами.
Можно ли запустить KMeans MLLIB (Apache Spark) с фиксированным начальным числом? Как?
Спасибо и привет,
Что касается Spark 1.2, кажется, что это невозможно. Он генерирует семя внутри.
Начальное значение для KMeans доступно в Spark MLLib, начиная с версии 1.4.0. См. библиотеку документов здесь
kmeans.seed
и он очень быстрый. - person Has QUIT--Anony-Mousse   schedule 25.12.2014