Я провожу сравнение цен на AWS Glue и AWS EMR, чтобы выбрать между EMR и Glue.
Я рассмотрел 6 DPU (4 виртуальных ЦП + 16 ГБ памяти) с выполнением задания ETL в течение 10 минут в течение 30 дней. Предполагается, что ожидаемое количество запросов сканера превышает уровень бесплатного пользования на 1 миллион и рассчитывается из расчета 1 доллар за 1 миллион дополнительных запросов.
На EMR я рассматривал m3.xlarge как для EC2, так и для EMR (цена 0,266 и 0,070 доллара соответственно) с 6 узлами, работающими в течение 10 минут в течение 30 дней.
При подсчете за месяц я вижу, что AWS Glue стоит около 14,64 доллара, а для EMR - около 10,08 доллара. Я не учел другие дополнительные расходы, такие как S3, RDS, Redshift и т. Д. И конечную точку DEV, которая не является обязательной, поскольку моя цель - сравнить преимущества цены работы ETL.
Похоже, что EMR дешевле по сравнению с AWS Glue. Правильно ли указаны цены на EMR, может ли кто-нибудь предложить, если чего-то не хватает? Я попробовал калькулятор цен AWS для EMR, но запутался и не понял, учитываются ли в нем нормализованные часы.
С Уважением
Юва