Мне было интересно, есть ли способ подключить вывод Hive напрямую к потоковому заданию Hadoop без использования промежуточных файлов. Я мог бы использовать INSERT OVERWRITE DIRECTORY, чтобы создать временный файл, а затем запустить потоковое задание Hadoop, однако мне было интересно, есть ли способ сделать это без временного файла.
Подключите Hive к потоковой передаче Hadoop
Ответы (1)
В улье есть поддержка потоковой передачи, ознакомьтесь с разделом «Потоковая передача» на странице https://cwiki.apache.org/confluence/display/Hive/GettingStarted
Вы можете попробовать дать банку mr job и т. Д. В качестве «скрипта» для потоковой передачи результатов запроса на
person
Urvishsinh Mahida
schedule
24.10.2014