Я анализирую большое количество сложных файлов (в основном CSV-файлы, но некоторые нет), и мне нужно структурировать/разбирать их в некоторые стандартные форматы. Это включает не только очистку данных по строкам, но и некоторую простую логику на основе отдельных ячеек. Мне нужен инструмент, который может использовать и непрограммист, чтобы член бизнес-группы мог написать простую логику перетаскивания и не отнимать время на разработку. До сих пор я рассматривал Google Refine и обработчик данных, и последний выглядит великолепно. Есть ли другие подобные инструменты?
Какие есть хорошие инструменты для очистки данных?
Ответы (1)
Инструменты ETL больше ориентированы на реляционные базы данных, но также поддерживают ввод/вывод файлов XML и CSV. Примеры:
Однако это может быть слишком сложно для ваших требований. Также см. этот аналогичный вопрос на SO (с дополнительными ссылками): Какое программное обеспечение доступен для проверки качества данных .
person
kaliatech
schedule
12.02.2012
Другой инструмент ETL с возможностями очистки данных, обычно упоминаемый вместе с двумя выше, — это CloverETL.
- person Jan Tichy; 13.02.2012