Я пытаюсь перенести всю таблицу из моего экземпляра RDS (MySQL 5.7) либо в S3 (CSV-файл), либо в Hive.
Всего в таблице 2 ТБ данных. И у него есть столбец BLOB, в котором хранится zip-файл (обычно 100 КБ, но может достигать 5 МБ).
Я провел несколько тестов со Spark, Sqoop и AWS DMS, но со всеми из них у меня возникли проблемы. У меня нет опыта экспорта данных из RDS с помощью этих инструментов, поэтому я очень ценю любую помощь.
Какой из них наиболее рекомендуется для этой задачи? И какая стратегия, на ваш взгляд, более эффективна?