Pentaho DI (Kettle) лучший способ выбрать поток на основе заголовка CSV-файла?

Я использую Pentaho DI (чайник) и не уверен, как лучше всего сделать следующее: из загруженного CSV-файла проверьте, существует ли столбец, и на его основе выберите правильный следующий шаг. Есть 3 возможных варианта.

Спасибо, Исаак


person isaapm    schedule 01.02.2016    source источник


Ответы (1)


Вы не упомянули возможные варианты, поэтому я просто предоставлю вам скетч, показывающий, как проверить, существует ли столбец в файле.

Для этого вам понадобится шаг CSV file input и шаг Metadata structure of stream, которые будут считывать метаданные входящего потока.

Преобразование

Для примера CSV-файла с тремя столбцами с именами col1, col2 и col3 вы получаете каждый столбец в отдельной строке с его именем в качестве значения в столбце Fieldname на шаге Метаданные.

Результаты метаданных

Затем, в зависимости от ваших потребностей, вы можете использовать, например, шаг Filter Rows или Switch / Case для дальнейшей обработки.

person Kamil Gosciminski    schedule 01.02.2016