Рута- Аббревиатура находка

Есть ли способ найти аббревиатуру незадолго до ее расширения с помощью Uima Ruta.

Образец входного документа

Наука о данных» широко признается как все более мощная сила в области веб-управления и разработки, а также в обществе в целом. ML — это приложение искусственного интеллекта. Он нашел банкомат (банкомат). Он позволяет этим компаниям постоянно внедрять инновации и повышать удобство работы пользователей с помощью приложения «Быстрые деньги в любое время» (ATM). Эти последние две компании ATM работают над восстановлением конкурентных преимуществ в развивающейся сети, используя методы обработки данных, включая обработку естественного языка (NLP) и машинное обучение (ML)< /сильный>

Проблема

Я хочу получить значения, только ML, а не ATM, потому что он используется как краткая форма только после расширения. Есть ли способ сделать это?


person prasanth    schedule 13.06.2019    source источник
comment
Не могли бы вы перефразировать свой вопрос, поскольку я не уверен, что понимаю его. Вы хотите обнаружить один ML, потому что вы нашли аббревиатуру в сочетании с ее полной формой где-то еще?   -  person Peter Kluegl    schedule 17.06.2019
comment
@PeterKluegl, да, мне нужно определить только Ml, потому что раньше он использовался в сокращении.   -  person prasanth    schedule 27.06.2019


Ответы (1)


Вот пример того, как проецировать аннотации, используя упрощенное определение определения. Это помогает?

PACKAGE uima.example;

DECLARE AbbreviationDefinition;
DECLARE AbbreviationLongform;
DECLARE Abbreviation;

STRINGLIST definedAccronyms;
INT expectedWordcount;

(W[expectedWordcount, expectedWordcount]{-> AbbreviationLongform} 
    SPECIAL.ct=="(" 
    c:@CAP{-> Abbreviation}<-{c{-> expectedWordcount = (c.end-c.begin)};} 
    SPECIAL.ct==")"
    ){-> AbbreviationDefinition};

// TODO check first characters of Abbreviation and AbbreviationLongform and remove annotations again if required

a:Abbreviation{PARTOF(AbbreviationDefinition) -> ADD(definedAccronyms, a.ct)};

MARKFAST(Abbreviation, definedAccronyms);


Abbreviation->{a:@Abbreviation{-> UNMARK(a)} ANY; ANY a:@Abbreviation{-> UNMARK(a)};};
a:Abbreviation{CONTAINS(Abbreviation,2,2) -> UNMARK(a)};

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: я разработчик UIMA Ruta

person Peter Kluegl    schedule 03.07.2019
comment
Дайте мне знать, если у вас есть вопросы об этих правилах. - person Peter Kluegl; 03.07.2019