AWS Glue - запуск задания ETL и ожидающее выполнение

Иногда, когда я хочу запустить задание ETL в AWS Glue, оно запускается немедленно. Но довольно часто у меня случается, что до того, как задание ETL что-то делает, проходит несколько минут - я ничего не вижу в журналах, только «ожидающее выполнение». Могу ли я как-то повлиять на это в конфигурации? Или это полностью зависит от AWS, когда она начнет работу?


person tommy vercetti    schedule 26.10.2018    source источник
comment
Возможный дубликат AWS Glue занимает много времени, чтобы закончить работу   -  person j.b.gorski    schedule 29.10.2018
comment
Помимо комментария @ j.b.gorski, журналы не всегда могут быть полностью сброшены в CloudWatch до некоторого времени после завершения задания ETL.   -  person Kyle    schedule 31.10.2018
comment
@Kyle, я сомневаюсь, что в моем случае я постоянно обновляю ведро s3, в которое я пишу данные с помощью задания Glue, и я ничего не вижу в течение нескольких минут, когда он говорит об ожидающем выполнении   -  person Ash    schedule 17.01.2019


Ответы (1)


Я знаю, что это старая ветка, но недавно я испытал те же симптомы. Вам нужно будет подтвердить, была ли причина такой же. Первоначально я создал задание по перемещению данных из озера данных в базу данных с красным смещением. Когда задание было создано, у него было соединение с красным смещением в качестве необходимого ресурса, но похоже, что клей не смог получить этот ресурс до запуска задания, поэтому задание будет терпеть неудачу до того, как оно начнется каждый раз ... без журналов.

Я удалил соединение как требование для работы, отредактировав задание с консоли. (Действие-> Изменить задание-> Требуемые соединения -> «X»)

После того, как я удалил требование, работа прошла нормально. Мне потребовалось много времени, чтобы понять это. Надеюсь, это поможет кому-нибудь еще столкнуться с тем же сценарием.

person user11985428    schedule 27.08.2019