Мы работаем с таблицами U-SQL и у нас есть вопросы, связанные с кластерным индексом. В таблице U-SQL параллелизм управляется тем, как данные секционируются и распределяются. Влияет ли кластерный индекс на параллелизм в таблице U-SQL? Во-вторых, как он справляется с перекосом данных в раздаточной корзине?
Влияет ли кластерный индекс в таблице U-SQL на параллелизм?
Ответы (1)
Кластерный индекс не влияет на параллелизм сам по себе, но может повлиять, если вы читаете данные с помощью поиска или сканирования индекса в зависимости от предиката запроса. Таким образом, это влияет на производительность доступа к данным внутри вершины.
Перекос данных не регулируется. Если у вас есть перекос, вам придется либо найти лучший ключ распределения, либо использовать подсказку коэффициента перекоса, либо использовать распределение ROUND ROBIN
.
person
Michael Rys
schedule
19.05.2017