Я использую функцию Корпуса для чтения файла, который я создал в указанном ниже каталоге.
chk <- Corpus(DirSource("C:\\Users\\TCS Profile\\Documents\\R\\Machine Learning Text\\Naive Bayes"))
После создания корпуса, когда я проверяю созданную переменную chk, я обнаруживаю, что содержимое было прочитано:
str(chk)
List of 1
$ Test.txt:List of 2
..$ content: chr [1:7] "Hi Wassup" "How are You" "Hope it Works!!!" "" ...
..$ meta :List of 7
.. ..$ author : chr(0)
.. ..$ datetimestamp: POSIXlt[1:1], format: "2015-10-14 16:15:17"
.. ..$ description : chr(0)
.. ..$ heading : chr(0)
.. ..$ id : chr "Test.txt"
.. ..$ language : chr "en"
.. ..$ origin : chr(0)
.. ..- attr(*, "class")= chr "TextDocumentMeta"
..- attr(*, "class")= chr [1:2] "PlainTextDocument" "TextDocument"
- attr(*, "class")= chr [1:2] "VCorpus" "Corpus"
Проблема в том, что я не могу получить доступ к определенному значению в содержимом, скажем, к третьему элементу. (Надеюсь, это сработает!!) Я попытался использовать следующий код:
chk[[1]][1,3]
Ошибка в chk[[1]][1, 3]: неправильное количество измерений
Кто-нибудь может сказать мне, как я могу получить доступ к соответствующему элементу и почему такая ошибка возникает для вышеуказанного типа доступа?
chk$Test.txt$content[3]
- самый ясный способ. Изменение вашего пути:chk[[1]][[1]][3]
. Запустите его по частям, чтобы вы могли понять, как это сделать в следующий раз, например,chk$Test.txt
иchk$Test.txt$content
- person Frank   schedule 14.10.2015names(chk)
. У меня сложилось впечатление отstr
, что"Test.txt"
было именем верхнего объекта, но, возможно, я ошибаюсь. - person Frank   schedule 14.10.2015.
в именах объектов. Хотя я не совсем уверен. Добавление кавычек должно сделать это,chk$"Test.txt"
- person Frank   schedule 14.10.2015