Я изучал хауоп, я обнаружил, что количество редукторов очень запутанно:
1) Количество редукторов равно количеству разделов.
2) Количество редукторов равно 0,95 или 1,75, умноженное на (количество узлов) * (количество максимальных контейнеров на узел).
3) Количество редукторов задается mapred.reduce.tasks.
4) Количество редукторов ближе всего к: кратному размеру блока * время выполнения задачи от 5 до 15 минут * создает наименьшее возможное количество файлов.
Я очень запутался, мы явно задаем количество редукторов или это делается самой программой mapreduce?
Как рассчитывается количество редукторов? Подскажите, пожалуйста, как рассчитать количество редукторов.