Я делаю несколько тестов с заданиями M/R, работающими на 2 узлах кластера Hadoop 2.2.0. Одна вещь, которую я хотел бы понять, — это соображения производительности при запуске задания в локальном режиме (не управляемом ResourceManager) и его запуске в YARN. Тесты, которые я провел, показывают, что работа выполняется намного быстрее, когда задание выполняется через LocalJobRunner, чем когда оно управляется YARN. При настройке кластера я выполнял шаги, описанные здесь http://raseshmori.wordpress.com/2012/10/14/install-hadoop-nextgen-yarn-multi-node-cluster/ , возможно, есть какая-то конфигурация, которую руководство забыло упомянуть?
Спасибо!