это должно быть просто, но я как-то упускаю это. У меня есть код:
import nltk
f=open('...\\t.txt','rU')
raw=f.read()
tokens = nltk.word_tokenize(raw)
print nltk.pos_tag(tokens)
который возвращает, например:
"[('процессы', 'NNS'), ('a', 'DT'), ('последовательность', 'NN'), ('из', 'IN'), ('слова', 'NNS' )]
Мне было интересно, как я мог просто собрать, например, только все «NN» или все «DT» И «IN» вместо каждого члена строки.
заранее спасибо