Я пытаюсь классифицировать текстовые документы по количеству категорий. Мой код ниже работает нормально
matrix[[i]] <- create_matrix(trainingdata[[i]][,1], language="english",removeNumbers=FALSE,stemWords=FALSE,weighting=weightTf,minWordLength=3)
container[[i]] <- create_container(matrix[[i]],trainingdata[[i]][,2],trainSize=1:50,testSize=51:100) ,
models[[i]] <- train_models(container[[i]], algorithms=c("MAXENT","SVM"))
results[[i]] = classify_models(container[[i]],models[[i]])
Когда я пытаюсь использовать приведенный ниже код, чтобы получить значения точности, отзыва, точности:
analytic[[i]] <- create_analytics(container[[i]], results[[i]])
Я получаю следующую ошибку:
Error in `row.names<-.data.frame`(`*tmp*`, value = c(NA_real_, NA_real_ :
duplicate 'row.names' are not allowed
Мои Categories
имеют формат text
. Если я конвертирую эти categories
в Numeric
- приведенный выше код работает нормально.
Есть ли обходной путь, чтобы сохранить категории в формате text
и получить значения точности, отзыва, точности.
Моя цель - получить значения точности, отзыва, точности и матрицу путаницы для многоклассового классификатора. Есть ли какой-либо другой пакет для получения вышеуказанных значений для классификатора Multi-Class Text (один против всех)
factor(Categories)
работает на тебя - person Silence Dogood   schedule 10.05.2014