Теоретически да, Hive должен уметь делать все то же самое, что и Java-код, и фреймворки для уменьшения карты. Я не являюсь пользователем Hadoop/Hive, но я понимаю, что Hive — это слой поверх Hadoop, и все, что делает Hive (включая аналитические расширения, написанные на Java), будет переведено в задания Hadoop. Вы можете задать вопрос, направленный Hive, о том, как и что нужно для этого.
Напротив, Aster SQL/MR встроен в базу данных Aster. Под собственным я подразумеваю, что Java работает на каждом узле Aster как часть платформы Aster SQL/MR, которая, в свою очередь, является неотъемлемой частью ядра базы данных Aster. Все манипуляции с данными будут согласовываться с моделью данных, ключами распределения данных и т. д. В Aster при использовании его функций SQL/MR (в том числе на основе Java) пользователь никогда не покидает пределы SQL и модели данных. В то же время SQL/MR полиморфен для определения таблиц, адаптирующихся к произвольным моделям (все в рамках Aster SQL). Может быть, вы хотите узнать, как это будет работать в Hive.
Еще один момент, на который стоит обратить внимание, это то, что Aster предлагает богатый набор высокоуровневых аналитических функций из коробки, поэтому может не потребоваться написание собственного Java SQL/MR. Таким образом, пример подсчета слов может быть выполнен с использованием функции nGram
и агрегированного SQL.
person
topchef
schedule
08.07.2013