Подключите Hive к потоковой передаче Hadoop

Мне было интересно, есть ли способ подключить вывод Hive напрямую к потоковому заданию Hadoop без использования промежуточных файлов. Я мог бы использовать INSERT OVERWRITE DIRECTORY, чтобы создать временный файл, а затем запустить потоковое задание Hadoop, однако мне было интересно, есть ли способ сделать это без временного файла.


person Jon    schedule 24.10.2014    source источник


Ответы (1)


В улье есть поддержка потоковой передачи, ознакомьтесь с разделом «Потоковая передача» на странице https://cwiki.apache.org/confluence/display/Hive/GettingStarted

Вы можете попробовать дать банку mr job и т. Д. В качестве «скрипта» для потоковой передачи результатов запроса на

person Urvishsinh Mahida    schedule 24.10.2014