У меня есть кадр данных Python Pandas, где мне нужно лемматизировать слова в двух столбцах. Я использую для этого использование spacy.
import spacy
nlp = spacy.load("en")
Я пытаюсь использовать лемматизацию на основе этого примера (который отлично работает):
doc3 = nlp(u"this is spacy lemmatize testing. programming books are more better than others")
for token in doc3:
print (token, token.lemma, token.lemma_)
Я переписал это, чтобы перебрать каждую строку одного из столбцов в моем кадре данных:
for row in example['col1']:
for token in row:
print(token.lemma_)
Это работает, однако я не смог понять, как заменить слова в col1 лемматизированными словами.
Я пробовал это, что не возвращает ошибку, но и не заменяет никаких слов. Любая идея, что происходит не так?
for row in example['col1']:
for token in row:
token = token.lemma_