Иногда я хотел бы выполнить какой-нибудь простой облегченный MapReduce. «Простой» означает, что он использует очень простой алгоритм, а «легковесный» означает, что я могу реализовать его несколькими строками на каком-то языке сценариев (или что-то в этом роде).
Моя текущая задача - получить данные из файлов из каталога в локальной файловой системе, сделать минимальную обработку и записать их в HBase. Hadoop Streaming может читать из локальной файловой системы. Однако он не может писать в HBase. В проекте hadoop-hbase-streaming заявлена такая функциональность. К сожалению, я не мог заставить его работать. Я думаю, это потому, что последний коммит в хранилище библиотеки был в 2008 году. Моя задача выглядит довольно обычной, и мне интересно, почему с 2008 года нет никаких обновлений библиотеки hadoop-hbase-streaming. Думаю, в настоящее время есть другие способы достичь моих целей. Не могли бы вы сказать мне, что это за способы?