Я пытаюсь написать код, который будет читать из набора CSV с именем my_file_*.csv
в фреймворк Dask.
Затем я хочу установить разделы в зависимости от длины CSV. Я пытаюсь сопоставить функцию для каждого раздела, и для этого каждый раздел должен быть всем CSV.
Я попытался сбросить индекс, а затем установить разделы на основе длины каждого CSV, но похоже, что индекс фрейма данных Dask не уникален.
Есть ли лучший способ разбиения на разделы в зависимости от длины каждого CSV-файла?