Вопросы по теме 'document-classification'

Как создать кластеры документов с помощью иерархической кластеризации
Я пытаюсь сгруппировать документы на основе их сходства, идея состоит в том, чтобы сопоставить похожие слова в двух документах и ​​разделить это число на общее количество слов в обоих документах. Каждое значение хранится в двумерном массиве:...
197 просмотров

Как я могу сравнить классификаторы в наборе данных с помощью любого t-теста?
Я хочу сравнить классификаторы наборов данных с помощью любого t-теста. мой вопрос здесь, что я должен использовать для этого сравнения. бывший. классификатор 1 Я построю столбец для точности, точности, полноты и т. д.; и то же самое для...
1299 просмотров

Create_Analytics в RTextTools
Я пытаюсь классифицировать текстовые документы по количеству категорий. Мой код ниже работает нормально matrix[[i]] <- create_matrix(trainingdata[[i]][,1],...
1878 просмотров

Как использовать все возможности rpart?
Я использую пакет rpart для классификации дерева решений. У меня есть фрейм данных с примерно 4000 функциями (столбцами). Я хочу использовать все функции rpart() для своей модели. Как я могу это сделать? По сути, rpart() попросит меня...
1263 просмотров

недопустимый тип (символ) аргумента
Это сообщение об ошибке в теме. Я получаю эту ошибку, когда пытаюсь запустить классификатор naive.bayes. Вот сводка моих данных о поездах: 'data.frame': 7269 obs. of 193 variables: $ pid : int 2 4 5 7 10 11 14 18 25 31 ... $ acquir...
7354 просмотров

Категоризация текста Python с использованием TFIDF
У меня есть набор данных, как показано ниже **ID** **Text** **Category** 1 jake loves me more than john loves me Romance 2 july likes me more than robert loves me...
620 просмотров

Классификация текста/классификация документов с маркировкой последовательностей с помощью молотка
У меня есть документы, расположенные в папках как классы, называемые категориями. Для нового ввода (например, заданного вопроса) я должен определить его категорию. Как лучше всего это сделать с помощью MALLET? Я просмотрел несколько статей об этом,...
387 просмотров

Классификация текстовых документов с помощью nltk
В настоящее время я работаю над проектом, в котором я принимаю электронные письма, удаляю тела сообщений с помощью пакета электронной почты, а затем хочу классифицировать их, используя такие ярлыки, как спорт, политика, технологии и т. Д. Я успешно...
5079 просмотров