Загрузка корпуса банка деревьев с набором тегов коричневого цвета

У меня есть корпус дерева WSJ от nltk. Я хочу загрузить его с набором тегов коричневого корпуса. Является ли это возможным?

import nltk
wsj = nltk.corpus.treebank.tagged_sents(tagset ='universal') # universal tags
wsj2 = nltk.corpus.treebank.tagged_sents() # treebank specific tags

person pg2455    schedule 22.07.2015    source источник


Ответы (1)


Согласно обсуждению в этой ветке, это невозможно.

Пока что NLTK предоставляет только возможность сопоставления определенных наборов тегов с универсальным набором тегов. Возможно, поможет одно из предложенных в обсуждении решений:

Очевидно, это еще не поддерживается в NLTK, но см. инструмент Interset Дэна Земана или мой сценарий по адресу https://gist.github.com/nschneid/6476715

person b3000    schedule 23.07.2015