Я хотел бы использовать лемматизатор wordnet
для лемматизации слов в a
> a<-c("He saw a see-saw on a sea shore", "she is feeling cold")
> a
[1] "He saw a see-saw on a sea shore" "she is feeling cold"
Я преобразовываю a
в корпус и выполняю шаги предварительной обработки (например, удаление стоп-слов, лемматизация и т. д.).
> a <- Corpus(VectorSource(a))
Я хотел сделать лемматизацию следующим образом:
> filter <- getTermFilter("ExactMatchFilter", a, TRUE)
> terms <- getIndexTerms("NOUN", 1, filter)
> sapply(terms, getLemma)
но я получаю эту ошибку
> filter <- getTermFilter("ExactMatchFilter", a, TRUE)
Error in .jnew(paste("com.nexagis.jawbone.filter", type, sep = "."), word, :
java.lang.NoSuchMethodError: <init>
Моя идея состоит в том, чтобы лемматизировать весь корпус, а не одно слово. Как это можно сделать?