В чем разница между Stanford Tagger, Parser и CoreNLP?

В настоящее время я использую разные инструменты от Stanford NLP Group и пытаюсь понять разницу между ними. Мне кажется, что они каким-то образом пересекаются друг с другом, поскольку я могу использовать одни и те же функции в разных инструментах (например, tokenize и POS-Tag, предложение может быть выполнено с помощью Stanford POS-Tagger, Parser и CoreNLP).

Я хотел бы знать, в чем на самом деле разница между каждым инструментом и в каких ситуациях я должен использовать каждый из них.


person Felipe Leão    schedule 02.06.2013    source источник


Ответы (1)


Все классы Java из одного и того же выпуска одинаковы и, да, они перекрываются. С точки зрения кода, синтаксический анализатор и теггер - это в основном подмножества того, что доступно в CoreNLP, за исключением того, что у них есть несколько собственных небольших надстроек, таких как графический интерфейс для анализатора. Что касается предоставленных моделей, синтаксический анализатор и теггер поставляются с моделями для ряда языков, тогда как CoreNLP из коробки поставляется только с английским языком. Однако затем вы можете загрузить jar-файлы для конкретных языков для CoreNLP, которые предоставляют все имеющиеся у нас модели для разных языков. Все, что доступно в любом из выпусков, присутствует на сайте CoreNLP на github: https://github.com/stanfordnlp/CoreNLP

person Christopher Manning    schedule 02.06.2013
comment
Большое спасибо за простой ответ, в настоящее время я работаю только с английским языком, и я всегда не понимаю, какой инструмент мне следует добавить в свой собственный проект. Я думаю, что пока буду придерживаться CoreNLP. :) - person Felipe Leão; 02.06.2013