Я использую tm_map(testfile, removeNumbers) для удаления номеров текстового файла. Однако мне нужно сохранить числа, которые сопровождают такие слова, как ipv4 и ipv6. Как я могу использовать функцию removeNumbers для удаления других номеров, но сохранить номера, которые поставляются с ipv4 и ipv6?
Это код, который я использовал:
test.txt = "this is a test file with numbers 1,2 and 3.
The internet protocals ipv4 and ipv6"
library(tm)
test <- Corpus(DirSource('C:test'), readerControl = list(reader = readPlain))
test <- tm_map(test, removeNumbers)
inspect(test[1])
Выход:
$test.txt
this is a test file with numbers , and . The internet protocals ipv and ipv