Я хотел знать, каков прирост или потеря производительности, если я использую свинью в локальном режиме (который внутренне вызывает уменьшение карты) по сравнению с использованием файла PIG-withouthadoop.jar.?
Действительно ли PIG-withouthadoop.jar не использует hadoop???
И если я хочу использовать Pig только без кластеров, например, спроектировать поток данных, то что мне использовать? Свинья в локальном режиме ИЛИ свинка без файла hadoop.jar??
В настоящее время я написал свой скрипт, используя локальный режим свиньи, и, пытаясь развернуть на сервере и настроить PIG в локальном режиме, я думаю, что мне также нужно установить HADOOP_HOME в переменных среды перед установкой переменной PIG_HOME.
Пожалуйста совет..
Заранее спасибо. :)