В чем разница между данными apache hive и Aster с точки зрения аналитических функций?

Я наткнулся на то, что показало, что в Hive можно писать аналитические функции.

Например: для примера с количеством слов мы также можем писать в улье. разница будет заключаться в том, что в данных Aster они уже встроены, тогда как в Hive мы должны их записать.

В чем будет разница? зачем идти на что?

hiveql teradata-aster sql-mr

DrewRose 04.07.2013 источник

comment

Используете ли вы SQL-H в Aster для работы с узлами Hadoop? Или вы сравниваете Астру и Улей независимо друг от друга? - topchef 06.07.2013

comment

Я знаю, что в Aster есть SQL-H. просто я наткнулся на то, что Hive может решать те же проблемы с подсчетом слов. Так может ли Hive выполнять все хотя бы базовые аналитические функции, если я могу их написать? - DrewRose 08.07.2013

comment

я хочу знать разницу между Aster и Hive, если Hive может выполнять аналитические функции, то так же, как Aster? - DrewRose 08.07.2013

Ответы (2)

arrow_upward
1
arrow_downward

Существует хорошее исследование, основанное на лабораторном исследовании, в котором сравнивается время разработки и выполнения аналитических функций как на платформе обнаружения Teradata Aster, так и на Hadoop/Hive. Системы были запущены параллельно, чтобы показать, какие рабочие нагрузки подходят для каждой системы. Есть хороший рабочий пример «дня из жизни» аналитика и требуемого времени/усилий (раскрытие информации: я работаю в Teradata, которая приобрела Aster Data 2 года назад) http://www.asterdata.com/resources/assets/ESG-Lab-Validation-Teradata-Aster-MapReduce-Platform.pdf

user2571199 11.07.2013

arrow_upward
0
arrow_downward

Теоретически да, Hive должен уметь делать все то же самое, что и Java-код, и фреймворки для уменьшения карты. Я не являюсь пользователем Hadoop/Hive, но я понимаю, что Hive — это слой поверх Hadoop, и все, что делает Hive (включая аналитические расширения, написанные на Java), будет переведено в задания Hadoop. Вы можете задать вопрос, направленный Hive, о том, как и что нужно для этого.

Напротив, Aster SQL/MR встроен в базу данных Aster. Под собственным я подразумеваю, что Java работает на каждом узле Aster как часть платформы Aster SQL/MR, которая, в свою очередь, является неотъемлемой частью ядра базы данных Aster. Все манипуляции с данными будут согласовываться с моделью данных, ключами распределения данных и т. д. В Aster при использовании его функций SQL/MR (в том числе на основе Java) пользователь никогда не покидает пределы SQL и модели данных. В то же время SQL/MR полиморфен для определения таблиц, адаптирующихся к произвольным моделям (все в рамках Aster SQL). Может быть, вы хотите узнать, как это будет работать в Hive.

Еще один момент, на который стоит обратить внимание, это то, что Aster предлагает богатый набор высокоуровневых аналитических функций из коробки, поэтому может не потребоваться написание собственного Java SQL/MR. Таким образом, пример подсчета слов может быть выполнен с использованием функции nGram и агрегированного SQL.

topchef 08.07.2013

comment

То есть такие аналитические функции теоретически можно сделать в Hive, но не будет ли это так просто, как в Aster? - DrewRose; 08.07.2013

comment

Простота относительна, и я не хочу сравнивать с Hive/Hadoop, о которых у меня очень мало знаний. Наилучшим путем было бы параллельное использование Hive/Hadoop и Aster и создание прототипов простых функций в обоих. Извините за отсутствие определенного ответа. - topchef; 08.07.2013

comment

Ох, хорошо. Без проблем. Спасибо за помощь.:) - DrewRose; 08.07.2013

В чем разница между данными apache hive и Aster с точки зрения аналитических функций?

Ответы (2)

Похожие вопросы