Мне нужно знать различные способы, с помощью которых мы можем выполнять проверки качества данных в выпуске информатики для больших данных. Нам нужно выполнить проверку качества данных в сотнях столбцов; большинство основных проверок - это проверка формата данных или проверка числа и т. д.
Как мы можем выполнять проверки качества данных с помощью Informatica Big data edition?
comment
Можешь точнее определить свою проблему? Для большинства проверок вы, вероятно, будете использовать преобразования Expression и писать операторы, которые проверяют значение и оценивают его как true/false.
- person Marek Grzenkowicz   schedule 18.04.2016
comment
Informatica Data Quality — специальный инструмент для такого рода операций. Однако вполне возможно реализовать все решение и в PowerCenter.
- person Maciejg   schedule 19.04.2016
Ответы (1)
Если ваш вопрос был специфичен для обеспечения качества данных в Hadoop или в режиме pushdown, то вы просто включаете режим pushdown, чтобы разрешить сопоставление для запуска среды выполнения I. hive/Hadoop, в остальном все аналогично обычному, где в вы кодируете в инструменте разработчика Informatica.
person
Volamr
schedule
23.04.2016