Насколько хороши GATE для НЛП?

Я пытаюсь создать приложение NLP, которое, по сути, должно выполнять распознавание именованных сущностей (NER). Я наткнулся на GATE. Насколько я понимаю, это фреймворк для создания приложений НЛП. Я тестировал ANNIE, систему IE, распространяемую с GATE, но результаты NER для моего домена не соответствуют ожиданиям. На самом деле любой NER, такой как Stanford CoreNLP или NLTK, не дает мне требуемых результатов. Поэтому я решил настроить существующие системы, чтобы получить желаемый результат.

Что касается GATE, мне понравились несколько вещей:
1. Модульность компонентов: например, в ANNIE такие компоненты, как Tokenizer, Gaztteer, Sentence splitter, POS tagger и т. Д., Могут использоваться независимо друг от друга.
2. Его язык правил называется JAPE, в котором есть очень хороший способ написания правил или шаблонов.

Но несколько вещей, которые я хочу знать о GATE:
1. Каковы другие основные преимущества GATE, особенно для NER?
2. Насколько гибким является GATE для добавления новых компонентов? Например, когда-нибудь я захочу использовать POS-теггер NLTK внутри GATE?
3. Если я захочу использовать пользовательские модели машинного обучения с GATE?
4. Я знаю, что группа НЛП в Университете Шеффилда участвует в GATE, но я хочу знать, насколько активно сообщество GATE и насколько активна поддержка GATE?
5. Можно ли использовать GATE для коммерческого программного обеспечения?

Внимательно ознакомьтесь с предложениями людей, которые действительно использовали GATE


person uzair_syed    schedule 23.02.2017    source источник
comment
Хотя мне также интересно узнать об опыте людей с GATE, я думаю, что этот вопрос слишком субъективен для критериев вопроса StackOverflow.   -  person Scott H    schedule 05.06.2017
comment
да, ты прав ... это объясняет ноль ответов :-)   -  person uzair_syed    schedule 07.06.2017


Ответы (1)


Хоть и поздно, но может кому-то пригодиться.

  1. Как вы уже упоминали, грамматики JAPE будут очень полезны, если они будут правильно написаны. Также встроенный GATE - еще одно большое преимущество, которое я считаю, поскольку мы можем настроить JAVA так, как мы хотели.
  2. Опять же, встроенный GATE можно использовать для добавления новых компонентов, где вы можете создавать свои собственные плагины. Однако, если вы хотите использовать инструменты Стэнфорда, они уже доступны в GATE. Вы можете просто подключить и играть.
  3. В GATE уже доступно множество алгоритмов, и я думаю, что они (Университет Шеффилда) постоянно его создают.
  4. служба поддержки GATE очень активна. Вы можете подписаться на их список рассылки и задавать вопросы, если вы есть, и они ответят как можно скорее.
  5. Полагаю, что так. Однако, если вы обратитесь непосредственно к команде GATE, они ответят вам лучше.
person Gopal    schedule 08.12.2017