Что может привести к снижению производительности Polybase при запросе больших наборов данных для вставки записей в хранилище данных Azure из хранилища BLOB-объектов?
Например, несколько тысяч сжатых (.gz) файлов CSV с заголовками, разделенными на несколько часов в день на данные за 6 месяцев. Запросы этих файлов из внешней таблицы в SSMS не совсем оптимальны и очень медленны.
Объективно я загружаю данные в Polybase, чтобы передать данные в хранилище данных Azure. За исключением того, что, похоже, с большими наборами данных Polybase работает довольно медленно.
Какие варианты оптимизации Polybase доступны здесь? Дождаться запроса или постепенно загружать данные после каждой загрузки в хранилище BLOB-объектов?