Мне нужно настроить кластер Hadoop на Google Compute Engine. Хотя это кажется простым либо с помощью веб-консоли Click&Deploy, либо с помощью командной строки. инструмент bdutil
, я обеспокоен тем, что для моих задач требуются дополнительные зависимости, присутствующие на машинах, например Xvfb
, Firefox
и другие, хотя все они устанавливаются через apt-get
.
Мне не ясно, как лучше пойти. Варианты, которые приходят мне в голову:
1) Я создаю собственный образ с дополнительными материалами и использую его для развертывания кластера Hadoop либо с помощью, либо с помощью щелчка и развертывания. Будет ли это работать?
2) Используйте стандартный образ и bdutil
с настраиваемыми файлами конфигурации (редактирование существующего), чтобы выполнить все sudo apt-get install xxx
. Это жизнеспособный вариант?
Вариант 1) — это в основном то, что мне приходилось делать в прошлом, чтобы запустить Hadoop на AWS, и, честно говоря, его сложно поддерживать. Я буду более чем доволен вариантом 2), но я не уверен, что butil
разрешено это делать.
Видите ли вы какой-либо другой способ настроить кластер Hadoop? Любая помощь приветствуется!