Я занимаюсь интеллектуальным анализом текста и хочу удалить апостроф "из моего текста (удалить его). Я пытался использовать gsub, как показано ниже, но он не работает
text <- "\"branch"
removeSpecialChars <- function(x){
result <- gsub('"',x)
return(result)
}
without <- removeSpecialChars(text)
Желаемый результат будет ветвью, а не веткой. Спасибо за вашу помощь.
ИЗМЕНИТЬ, чтобы продолжить (я пытаюсь очистить текст).
Input - это список, состоящий из множества различных строк. Например
Input <- list(c("e","b", "stackoverflow", "\"branch"))
cleanCorpus <- function(corpus){
corpus.tmp <- tm_map(corpus, removePunctuation,preserve_intra_word_dashes = TRUE)
removeSpecialChars <- function(x){
result <- gsub('"', "",x)
return(result)
}
corpus.tmp <- removeSpecialChars(corpus.tmp)
corpus.tmp <- tm_map(corpus.tmp, stripWhitespace)
corpus.tmp <- tm_map(corpus.tmp, content_transformer(tolower))
corpus.tmp <- tm_map(corpus.tmp, removeWords, stopwords("english"))
return(corpus.tmp)
}
result <- cleanCorpus(Input)
gsub('"', "", text)# [1] "branch"
- person akrun   schedule 12.05.2016gsub
звонке замены нет. - person akrun   schedule 12.05.2016corpus.tmp
? - person akrun   schedule 12.05.2016