Развертывание Mahout в кластере Hadoop

Я хочу запустить пример Mahout K-Means в кластере Hadoop из 5 машин. Какие jar-файлы Mahout мне нужно хранить на всех узлах, чтобы K-Means выполнялся распределенным образом. Спасибо.

-Венкирам


person Venkiram    schedule 15.04.2011    source источник


Ответы (1)


Если вы действительно просто хотите запустить встроенные K-средние или другие задания со статическими драйверами, ответ — «нет». JAR-файлы mahout «job» — это автономные JAR-файлы работы Hadoop. Если вы отправляете задание в кластер с помощью «задания Hadoop», оно будет работать без каких-либо других банок.

person bmargulies    schedule 15.04.2011
comment
Спасибо. Я установил jar-файлы Mahout на главном узле, должен ли я реплицировать его также на все подчиненные узлы? - person Venkiram; 15.04.2011
comment
Теперь вы выходите за рамки того, что я знаю о хаупе. - person bmargulies; 16.04.2011
comment
Разве драйвер задания не должен позаботиться об этом, локализовав .jar на всех используемых им узлах? - person Has QUIT--Anony-Mousse; 26.09.2012