Я получаю следующую ошибку:
'pattern' must be a non-empty character string
при попытке запустить следующее:
rapply(as.list(Database1), function(x) agrep(x,Database2, max.distance=c(cost=1), value=T))
с большими базами данных
> length(Database1)
[1] 15876500
> length(Database2)
[1] 605
Но не тогда, когда я запускаю его с маленькими
> length(Database1)
[1] 29
> length(Database2)
[1] 8
Я знаю, что должен создать воспроизводимый код, чтобы базы данных представляли собой всего 15-25 строк символов случайных букв, которые можно сгенерировать, используя следующее:
Database1<- unlist(replicate(n, paste0(sample(LETTERS, m), collapse="")))
где «n» — длина, а «m» — целое число от 15 до 25.