Задний план
Хотите автоматизировать создание доменов в JasperServer. Домены — это «представление» данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю в удобочитаемом виде.
Проблема
Существует более 2000 возможных фрагментов данных, которые организация теоретически могла бы включить в отчет. Данные получены из неудобных для человека имен, таких как:
payperiodmatchcode workdistributioncodedesc зависитотношение действиеendoption actionendoptiondesc addresstype addresstypedesc historytype psaddresstype rolename bankaccountstatus bankaccountstatusdesc bankaccounttype bankaccounttypedesc бенефициарсумма бенефициаракласс бенефициарапроцентная выгодаподкласс бенефициаракласс бенефициараклассдеск выгодакод действиявыгодакоддескавыгодаконтрольная выгодауправление возрастомуправленияуправление возрастомуправлениеуведомление
Вопрос
Как бы вы автоматически изменили такие имена на:
- код соответствия периода оплаты
- код распределения труда описание
- зависимые отношения
Идеи
Используйте Вы имели в виду движок, однако я думаю, что он нарушает их TOS:
lynx -dump «url» | grep "Did you mean" | awk ...
Языки
Подойдет любой язык, но лучше всего подойдут анализаторы текста, такие как Perl. (Имена столбцов только на английском языке.)
Ненужная префекция
Цель состоит не в том, чтобы на 100 % разбить слова на части; допустим следующий результат:
- enrollment Effectivedate -> Дата вступления в силу регистрации
- enrollmentenddate -> Дата регистрации мужчин
- enrollmentrequirementset -> Набор требований для регистрации
Несмотря ни на что, человеку нужно будет перепроверить результаты и исправить многие из них. Сокращение набора из 2000 результатов до 600 правок было бы существенной экономией времени. Зацикливаться на некоторых случаях, имеющих несколько возможных вариантов (например, имя терапевта), значит полностью упускать суть.