Как прочитать список стоп-слов из текстового файла в R


person Sina    schedule 29.11.2012    source источник


Ответы (2)


Файл, разделенный новой строкой, технически может считаться действительным файлом CSV. Попробуйте read.csv() получить список в виде data.frame. Вы можете захотеть unlist его или просто получить доступ к первому столбцу, чтобы получить его в массиве, подобном тому, что у вас есть.

person Jeff Allen    schedule 29.11.2012
comment
Спасибо, теперь я могу прочитать файл, но как я могу получить его второй столбец, потому что первый столбец содержит количество строк, а мне это не нужно. - person Sina; 29.11.2012
comment
readCSV даже не является функцией в базе R. Я думаю, вы ищете read.csv. - person thelatemail; 29.11.2012
comment
@Sina: номера строк, которые вы видите при печати фрейма данных, на самом деле не рассматриваются как столбец. Получение первого столбца фрейма данных, например. с df[, 1], все равно должны дать вам слова. - person Marius; 29.11.2012

readLines мог бы работать здесь:

con <- file("filename.txt", "r")
readLines(con)

Хотя теперь, когда вы указываете, что слова «закавычены», это, вероятно, не очень хорошее решение, и вам лучше использовать read.csv("filename.txt")

person thelatemail    schedule 29.11.2012