Я настраиваю кластер hadoop 2.5.1 из 5 узлов с zookeeper, oozie, hive и hbase. В настоящее время у меня установлены и запущены hadoop 2 и zookeeper. Я хочу настроить какое-то управление пользовательским интерфейсом для всех служб, чтобы я мог отслеживать состояние и выполнять административные задачи с его помощью. Я вижу, что все документы для Ambari и Hue предназначены для Hortornworks и Cloudera соответственно. Есть ли какое-нибудь пошаговое руководство для любой из этих UI-консолей, в котором рассказывается, как настроить их для моих существующих служб hadoop?
Apache Hue или Apache Ambari - как установить и настроить их вручную
Ответы (3)
У Hue есть запись в блоге о том, как интегрироваться с любой кластер.
Мы также рекомендуем этот документ. Там написано Cloudera, но это та же инструкция для любого Hadoop (поскольку Hue использует только стандартные API).
Официально Ambari не поддерживает установку в существующий кластер. При его установке необходимо удалить предыдущие компоненты hadoop. Как упоминалось в FAQ по Ambari Установка нового кластера поверх существующего кластера
При установке кластера Hadoop через Ambari на узлах, на которых уже установлены биты Hadoop (включая существующий кластер, развернутый через Ambari), выполните следующие действия:
Stop all the services on all the nodes(including ganglia and nagios)
It is also a good practice to delete the rpms from all nodes.
search for the rpms:
rpm -qa | grep ganglia
rpm -qa | grep oozie
rpm -qa | grep sqoop
rpm -qa | grep pig
rpm -qa | grep nagios
rpm -qa | grep hadoop
and remove them :
rpm -e <package name>
В документации Hortonworks также есть инструкции по установке Hue:
Глава 14. Установка Hue
Hue требует, чтобы службы были остановлены в кластере, их не нужно удалять, как того требует установка Ambari.