У нашего клиента есть общая проблема с множеством распределенных хранилищ данных с различными технологическими стеками. Затем конечная цель - собрать вместе определенные части данных для создания подробных отчетов с помощью Microsoft Power BI.
Есть ли стандартный шаблон для этого подхода? Мои первоначальные мысли заключаются в том, чтобы
- По возможности, фабрика данных Azure для переноса данных в озеро данных Azure.
- Если это невозможно, автоматизируйте извлечение и сброс данных в Azure Data Lake.
- Пользовательский Power BI Desktop для подключения к наборам данных csv для создания модели и отчетов (при выполнении значительного преобразования)
- Публикуйте в сервисе PowerBI, чтобы поделиться им между пользователями
Обеспокоенность...
- Должны ли мы использовать DataFlows в фабрике данных (или какой-либо другой ETL) для преобразования ИЛИ продолжить использование редактора запросов в PowerBI
- Есть ли проблемы с производительностью при подключении большого количества наборов данных и выполнении значительных преобразований в PowerBI Desktop?
- Чтобы обновить отчет новыми данными, можно ли просто перезаписать предыдущий файл CSV в пакете данных и обновить отчет?