Я поигрался с AWS Glue для быстрой аналитики, следуя руководству здесь
Хотя мне удавалось успешно создавать сканеры и обнаруживать данные в Athena, у меня были проблемы с типами данных, созданными поисковым роботом. Типы данных date
и timestamp
читаются как типы данных string
.
Затем я создал ETL
задание в GLUE, используя источник данных, созданный поисковым роботом, в качестве входных данных и целевую таблицу в Amazon S3.
В рамках преобразования отображения я преобразовал типы данных даты и отметки времени как string
в timestamp
, но, к сожалению, ETL преобразовал эти типы столбцов в NULLS
. Я думал об использовании классификаторов с GROK
выражениями, но затем решил преобразовать их как часть ETL в GLUE.
Формат метки времени - 1/08/2010 6:15:00 PM
.