Должны ли мы следовать дистрибутиву Debian Hadoop или переходить на другие дистрибутивы, предоставляемые Cloudera, Hortonworks, MapR?

Мы использовали стандартный дистрибутив Hadoop, предоставленный сообществом Apache. Мы работаем над разработкой решения для аналитики продаж. На основе следующего документа https://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support

Кажется, многие компании предоставляют различные дистрибутивы и коммерческую поддержку Hadoop. В нашем случае мы используем только стандартный (Debian) дистрибутив Hadoop. Мы сталкиваемся со многими проблемами. Наш вопрос: будем ли мы использовать этот дистрибутив Debian Hadoop или перейдем на другие дистрибутивы, предоставляемые Cloudera, Hortonworks, MapR...?


person Sunil Poudel    schedule 02.12.2016    source источник


Ответы (1)


Есть множество факторов, которые будут влиять на ваше решение, но вот несколько советов:

Cloudera — самый дорогой из всех поставщиков. Их «Cloudera Manager» — это первоклассное программное обеспечение для управления кластером.

Hortonworks — наименее дорогие компоненты с полностью открытым исходным кодом.

MapR - где-то посередине с точки зрения стоимости, но определенно номер 1, когда речь идет о производительности. Они полностью избавились от NameNode и внесли некоторые другие важные изменения.

AWS — они позволяют вам использовать их инфраструктуру за небольшую почасовую плату. Поддержка составляет фиксированную сумму в размере 15 000 долларов США или переменную сумму для крупных компаний. Нет необходимости покупать оборудование, если вы используете эту опцию.

Есть много других дистрибутивов, таких как Pivotal, IBM и т. д., но эти три являются лидерами рынка.

Надеюсь это поможет.

person kashmoney    schedule 02.12.2016