Я новичок в программном обеспечении R
Теперь изучаем интеллектуальный анализ текста с использованием пакета «tm».
У меня проблема с преобразованием текста в нижний регистр
sms_raw<-read.csv(............)
sms_corpus<-Corpus(VectorSource(sms_raw$text))
sms_corpus<-Corpus(VectorSource(sms_raw$text))
tm_map(sms_corpus,content_transformer(tolower))
error:invalid multubytes string 1
Я думал, что мой CSV-файл может быть не utf-8, поэтому я восстановил его как utf-8, но это не сработало.
моя ОС win8.1
У кого-нибудь есть решение этой проблемы, пожалуйста, дайте мне знать.