Я пытаюсь создать приложение NLP, которое, по сути, должно выполнять распознавание именованных сущностей (NER). Я наткнулся на GATE. Насколько я понимаю, это фреймворк для создания приложений НЛП. Я тестировал ANNIE, систему IE, распространяемую с GATE, но результаты NER для моего домена не соответствуют ожиданиям. На самом деле любой NER, такой как Stanford CoreNLP или NLTK, не дает мне требуемых результатов. Поэтому я решил настроить существующие системы, чтобы получить желаемый результат.
Что касается GATE, мне понравились несколько вещей:
1. Модульность компонентов: например, в ANNIE такие компоненты, как Tokenizer, Gaztteer, Sentence splitter, POS tagger и т. Д., Могут использоваться независимо друг от друга.
2. Его язык правил называется JAPE, в котором есть очень хороший способ написания правил или шаблонов.
Но несколько вещей, которые я хочу знать о GATE:
1. Каковы другие основные преимущества GATE, особенно для NER?
2. Насколько гибким является GATE для добавления новых компонентов? Например, когда-нибудь я захочу использовать POS-теггер NLTK внутри GATE?
3. Если я захочу использовать пользовательские модели машинного обучения с GATE?
4. Я знаю, что группа НЛП в Университете Шеффилда участвует в GATE, но я хочу знать, насколько активно сообщество GATE и насколько активна поддержка GATE?
5. Можно ли использовать GATE для коммерческого программного обеспечения?
Внимательно ознакомьтесь с предложениями людей, которые действительно использовали GATE