У меня есть приложение производителя, которое записывает в поток Kinesis со скоростью 600 записей в секунду. Я написал приложение Apache flink для чтения / обработки и агрегирования этих потоковых данных и записи агрегированного вывода в AWS Redshift.
Средний размер каждой записи - 2 КБ. Это приложение будет работать 24 * 7.
Я хотел знать, какой должна быть конфигурация моего кластера AWS EMR. Сколько узлов мне нужно? Какой должен быть тип инстанса EC2 (R3 / C3).
Помимо производительности, для нас важна и стоимость.