Как указать пользовательский RecordReader
для использования в потоке заданий в Amazon EMR?
Примечание. Здесь новичок в Hadoop.
Как указать пользовательский RecordReader
для использования в потоке заданий в Amazon EMR?
Примечание. Здесь новичок в Hadoop.
Вы указываете формат ввода в своем классе драйвера (класс, содержащий «главный» задания. Средство чтения записей является логической частью вашего формата ввода, который фактически возвращает его в задачу сопоставления.
Я не думаю, что это что-то конкретное для ЭМИ.