Я использовал этот код:
# Step 1 : TOKENIZE
from nltk.tokenize import *
words = word_tokenize(text)
# Step 2 : POS DISAMBIG
from nltk.tag import *
tags = pos_tag(words)
чтобы пометить два предложения: John is very nice. Джон очень милый?
Джон в первом предложении был NN, а во втором - VB! Итак, как мы можем исправить функцию pos_tag без обучения отложенных тегировщиков?
Модифицированный вопрос:
Я видел демонстрацию тегов NLTK здесь http://text-processing.com/demo/tag/< /а>. Когда я попробовал вариант «English Taggers & Chunkers: Treebank» или «Brown Tagger», я получил правильные теги. Итак, как использовать, например, Brown Tagger без обучения?