Разобрать произвольный текст для создания графа зависимостей

Как создать граф зависимостей (дерево разбора) для случайных предложений. Есть ли готовый грамматик для разбора английских предложений с помощью nltk.

Пример:

Я хочу сделать дерево синтаксического анализа для предложения

«Большой компании нужна устойчивая бизнес-модель». который должен выглядеть так.

введите здесь описание изображения

Пожалуйста, предложите мне, как это можно сделать.


person Rohith    schedule 18.12.2012    source источник


Ответы (1)


Этот вопрос является почти дубликатом 3125926. Но я немного уточню ответ, данный там.

У меня нет личного опыта разбора зависимостей в NLTK, но, согласно принятому ответу, интеграция с MaltParser задокументировано по адресу http://nltk.googlecode.com/svn/trunk/doc/api/nltk.parse.malt.MaltParser-class.html

Если по какой-то причине MaltParser не соответствует вашим потребностям, вы также можете взглянуть на MSTParser и Stanford Parser. Я думаю, что эти три варианта наиболее известны, и я ожидаю, что один (или все) из них вам подойдет.

Обратите внимание, что Stanford Parser включает подпрограммы для преобразования из деревьев групп и между несколькими стандартными представлениями зависимостей, поэтому, если вам нужен определенный формат, вы можете посмотреть аргументы преобразования формата в класс edu.stanford.nlp.trees.EnglishGrammaticalStructure.

например, для преобразования деревьев избирательных округов в базовые зависимости:

java -cp stanford-parser.jar edu.stanford.nlp.trees.EnglishGrammaticalStructure -treeFile <input trees> -basic

person AaronD    schedule 20.12.2012