Я видел, что подобные вопросы уже существуют:
Резервное копирование AWS Dynamodb на S3
Копирование только новых записей из AWS DynamoDB в AWS Redshift а>
Загрузка данных из Amazon DynamoDB в красное смещение
К сожалению, большинство из них устарели (поскольку Amazon представила новые услуги) и / или имеют разные ответы.
В моем случае у меня две базы данных (RedShift и DynamoDB), и я должен:
- Регулярно обновляйте базу данных RedShift
- Хранить резервную копию базы данных на S3
Для этого я хочу использовать этот подход:
- Резервное копирование только новых / измененных записей из DynamoDB в S3 в конце дня. (1 файл в день)
- Обновить базу данных RedShift, используя файл из S3
Итак, мой вопрос: как это сделать наиболее эффективно?
Я прочитал это руководство, но я не уверен, что AWS Data Pipeline можно настроить так, чтобы «ловить» только новые записи из DynamoDB. Если это невозможно, сканировать всю базу данных каждый раз нельзя.
Заранее спасибо!