Список стоп-слов для r

stopwords (из пакета tm) возвращает различные виды игнорируемых слов с поддержкой разных языков. Например.

stopwords()

возвращает 175 английских стоп-слов. Я хотел бы знать, есть ли какие-то инструменты, которые предоставляют больше стоп-слов.


person Mark    schedule 10.04.2020    source источник


Ответы (1)


Если вы используете пакет stopwords, вы можете указать источник с более длинным списком.

> install.packages("stopwords")
> library("stopwords")
> SW = stopwords("en", source = "stopwords-iso")

> length(SW)
1298
person A.Yazdiha    schedule 10.04.2020