Верстак UIMA Ruta с Maven и ядром DKPro

Я пытаюсь использовать компоненты DKPro Core в рабочей среде RUTA, как в следующем примере с немецким романом: https://github.com/pkluegl/ruta

IMPORT PACKAGE de.tudarmstadt.ukp.dkpro.core.api.lexmorph.type.pos FROM desc.type.POS AS pos;
IMPORT de.tudarmstadt.ukp.dkpro.core.api.segmentation.type.Lemma FROM desc.type.LexicalUnits;

Maven правильно получает зависимости от DKPro Core. Хотя я могу выполнить основной скрипт ruta в Eclipse и получить файл xmi в выходном каталоге, я не могу открыть этот файл xmi в браузере аннотаций:

Caused by: XCASParsingException: Error parsing XCAS or XMI-CAS from source <unknown> at line <unknown>, column <unknown>: unknown type: de.tudarmstadt.ukp.dkpro.core.api.metadata.type.TagsetDescription.

Я предполагаю, что системы типов импорта DKPro Core недоступны для Workbench, и я понятия не имею, как решить эту проблему. Я попытался обновить родительский проект до текущей версии ruta (2.6.1, такой же, как мой рабочий стол ruta) без какого-либо лучшего результата.


person Julien    schedule 05.03.2018    source источник


Ответы (1)


Существуют разные варианты решения этой проблемы. Вы можете импортировать систему типов DKPRo Core, содержащую TagsetDescription, в сценарий Ruta, чтобы сгенерированное описание системы типов также предоставляло тип, если это описание системы типов используется для открытия XMI в редакторе CAS.

Я часто создаю описание системы типов, содержащее все описания систем типов, доступные в пути к классам проекта (uimaFIT types.txt), чтобы открывать XMI в редакторе CAS. Например, со следующим кодом:

protected void storeTypeSystem() {

        File tsFile = new File("TypeSystem.xml");

        try {

            TypeSystemDescription typeSystemDescription = TypeSystemDescriptionFactory.createTypeSystemDescription();
            try (OutputStream os = new FileOutputStream(tsFile)) {
                typeSystemDescription.toXML(os);
            }
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }

Вы можете указать описание системы типов, которое должно использоваться для всех файлов в проекте, в свойствах этого проекта: Свойства -> Система типов UIMA. По умолчанию он указывает на файл, созданный приведенным выше примером кода.

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: я разработчик UIMA Ruta

person Peter Kluegl    schedule 15.03.2018
comment
Пошел на импорт, было идеально. Я попробую другое решение в другой раз. Спасибо ! - person Julien; 16.03.2018