Какие есть хорошие инструменты для очистки данных?

Я анализирую большое количество сложных файлов (в основном CSV-файлы, но некоторые нет), и мне нужно структурировать/разбирать их в некоторые стандартные форматы. Это включает не только очистку данных по строкам, но и некоторую простую логику на основе отдельных ячеек. Мне нужен инструмент, который может использовать и непрограммист, чтобы член бизнес-группы мог написать простую логику перетаскивания и не отнимать время на разработку. До сих пор я рассматривал Google Refine и обработчик данных, и последний выглядит великолепно. Есть ли другие подобные инструменты?


person pathikrit    schedule 12.02.2012    source источник


Ответы (1)


Инструменты ETL больше ориентированы на реляционные базы данных, но также поддерживают ввод/вывод файлов XML и CSV. Примеры:

Однако это может быть слишком сложно для ваших требований. Также см. этот аналогичный вопрос на SO (с дополнительными ссылками): Какое программное обеспечение доступен для проверки качества данных .

person kaliatech    schedule 12.02.2012
comment
Другой инструмент ETL с возможностями очистки данных, обычно упоминаемый вместе с двумя выше, — это CloverETL. - person Jan Tichy; 13.02.2012