Как увидеть материал, напечатанный во время выполнения задания Hadoop

Я запускаю задание mapreduce в виртуальном боксе HortonWorks. В методе Map() я использую System.out.println("xx"), но не могу найти печатные слова.

Из Как печатать на консоли во время выполнения задания MapReduce в hadoop Я знаю, что могу найти журнал в веб-консоли jobtracker.
Но я не знаю, где найти веб-консоль jobtracker.

Как я могу это сделать?


person Frankie    schedule 19.02.2016    source источник


Ответы (2)


Тема 4-х летней давности. JobTracker и TaskTracker (MRv1) были преобразованы в Application Master и ResourceManager (MRv2:YARN). Вы можете увидеть статус своих заданий в веб-интерфейсе ResourceManager по адресу http://localhost:8088/.

Вывод (из Reporter или Println) обычно печатается в журналах задач на HistoryServer, который доступен по этому URL-адресу: http://localhost:19888/jobhistory/job/job_xxxxxxxxxx

PS: Если вы используете старую версию Hadoop, ваши выходные данные будут доступны через веб-интерфейс JobTracker: http://localhost:50030/jobtracker.jsp(Нажмите на завершенное задание-> нажмите на карту или уменьшите задачу-> нажмите на номер задачи-> журналы задач-> журналы стандартного вывода. )

person Mobin Ranjbar    schedule 19.02.2016
comment
Спасибо, Мобин, ты мне очень помог. - person Frankie; 20.02.2016

Спасибо Мобину за ответ на мой вопрос, позвольте мне добавить ответ на мой вопрос. Помимо решения, предоставленного Mobin, я нашел еще один способ проверить журналы работы Hadoop. Команда: yarn logs -applicationId {applicationId} может отображать журналы заданий Hadoop, сохраненные на сервере истории приложений, включая stderr, stdout и syslog. То, что напечатано оператором System.out.println(), сохраняется в stdout.

person Frankie    schedule 20.02.2016