У нас есть большие и широкие плоские файлы с данными телеметрии. Они приезжают каждый день.
Я собираюсь создать звездную схему в базе данных ADLA, которая будет заполнена данными из этих больших больших файлов. (похоже, ADLA DB предоставляет множество функций (в отличие от необработанного ADLS): индексы, статистика, сжатие, управление распределением ...)
Для генерации суррогатных ключей мы можем использовать:
- row_number
- хеширование
А как насчет хеширования? Какие функции мы можем использовать для его реализации? (Я думаю о C #)