Вопросы по теме 'naivebayes'

Взвешенный наивный байесовский классификатор в Apache Mahout
Я использую наивный байесовский классификатор для анализа настроений в отношении поддержки клиентов. Но, к сожалению, у меня нет огромных наборов аннотированных данных в области поддержки клиентов. Но у меня есть небольшое количество аннотированных...
983 просмотров

Реализация классификатора Bag-of-Words Naive-Bayes в NLTK
В основном у меня есть тот же вопрос как этот парень .. пример в книге NLTK для наивного байесовского классификатора рассматривает только то, встречается ли слово в документе как характеристику. слов»). Один из ответов предполагает, что это...
25654 просмотров
schedule 17.02.2024

Используйте наивный байесовский подход для числовых атрибутов
Можем ли мы использовать наивный байесовский метод для классификации числовых данных. У нас есть система, которая извлекает стили авторов, такие как длина предложения, длина слова, и использует их для прогнозирования авторства анонимных документов....
1511 просмотров
schedule 12.11.2023

Невозможно использовать Pandas и NLTK для обучения Naive Bayes (машинное обучение) в Python
Вот что я пытаюсь сделать. У меня есть CSV. файл со столбцом 1 с именами людей (например, «Майкл Джордан», «Андерсон Сильва», «Мухаммад Али») и столбцом 2 с этнической принадлежностью людей (например: англичане, французы, китайцы). В моем коде я...
874 просмотров

Классификатор NaiveBayes: нужно ли объединять все файлы одного класса?
Я реализую простой наивный байесовский классификатор, но не понимаю, как правильно рассчитать условную вероятность класса (P(d|c)) . Просто для полноты я хотел бы коротко пояснить используемую терминологию. Наивные байесовские вероятности...
85 просмотров

Как создать обучающий файл для Spark MLlib Naive Bayes и рассчитать TF–IDF
Мне нужно классифицировать множество продуктов в дереве категорий, я тестирую Spark и Mlib Naive Bayes. Но я не понимаю, как я могу рассчитать TF-IDF. У меня есть файл тренера, как это: #filenameTrainer: 103,355 4 50 60 71 72 66 73 57 53...
295 просмотров

Как получить вероятности (вместо одного фактического класса) из NaiveBayesModel в MLlib?
Я построил NaiveBayesModel в MLlib. Он отлично работает, но я хотел бы вернуть вероятности каждого класса для заданного ввода вместо окончательного и единственного решения модели, то есть, относится ли ввод к классу 1.0 или классу 0.0. Любые идеи?
221 просмотров

Наивный Байес в R, библиотека e1071: подобранная модель дает априорные вероятности в качестве прогнозов для каждой записи
Я использую Naive Bayes из библиотеки e1071. У меня есть следующий игрушечный набор данных с именем nb0.csv N_INQUIRIES_BIN,TARGET 1,0 2,1 2,0 1,0 1,0 1,0 1,1 Затем я использую следующие строки кода library(e1071) data =...
1356 просмотров
schedule 11.12.2022

Использование платформы Datumbox для машинного обучения с открытым исходным кодом
Я работаю в интеллектуальном новостном приложении для Android, приложение должно извлекать темы новостей, содержащие определенные ключевые слова, из опубликованных новостей в Интернете, а затем классифицировать их по категориям, я понятия не имею, как...
436 просмотров

недопустимый тип (символ) аргумента
Это сообщение об ошибке в теме. Я получаю эту ошибку, когда пытаюсь запустить классификатор naive.bayes. Вот сводка моих данных о поездах: 'data.frame': 7269 obs. of 193 variables: $ pid : int 2 4 5 7 10 11 14 18 25 31 ... $ acquir...
7354 просмотров

Оставьте One Out Scores 100%, что мне здесь не хватает?
Я пытаюсь выполнить одно резюме для своих статей, но когда я запускаю процедуру, я получаю 100% точность и не могу понять, что мне не хватает. Это мой код: import sklearn from sklearn.datasets import load_files import numpy as np from...
830 просмотров

Как сократить время классификации темы в наивном байесовском классификаторе textblob
Я использую pickle для сохранения классифицированной модели с помощью теоремы Байеса, я сохранил файл размером 2,1 ГБ после классификации с 5600 записями. но когда я загружаю этот файл, это занимает почти 2 минуты, но для классификации некоторого...
246 просмотров

Получение условных вероятностей для наивной байесовской модели, разработанной с использованием пакета вставки в R
Мой главный вопрос такой: Как получить условные вероятности для наивной байесовской модели с помощью пакета caret в R? Фон: Я запустил наивную байесовскую модель с использованием пакета caret в R. Набор данных по сути представляет собой...
249 просмотров
schedule 28.05.2023

Как я могу создать массив матриц из одной матрицы, используя первый столбец в качестве индекса?
Предположим, у меня есть следующая матрица, 1 2 3 4 5 6 7 8 2 3 4 5 6 7 8 1 3 4 5 6 7 8 1 2 4 5 6 7 8 1 2 3 1 8 7 6 5 4 3 2 2 7 6 5 4 3 2 9 3 6 5 4 3 2...
80 просмотров

Сбалансированный корпус для наивного байесовского классификатора
Я работаю с анализом настроений с использованием классификатора NB . Я нашел информацию (блоги, руководства и т. Д.) О том, что корпус обучения должен быть сбалансированным: 33,3% положительных; 33,3% Нейтрально 33,3% отрицательно Мой...
327 просмотров
schedule 12.12.2023

Производительность: повышение точности наивного байесовского классификатора
Я работаю над простым наивным байесовским текстовым классификатором, который использует Коричневый корпус для тестовых и обучающих данных. Пока что я получил точность 53% при использовании простого подхода без какой-либо предварительной обработки....
715 просмотров

sklearn (неверная форма ввода) ValueError
Я новичок в мире ML и sklearn. Я пытался использовать GaussianNB для набора данных с X_train[2500,800] , Y_train[2500,8] . from sklearn.naive_bayes import GaussianNB clf = GaussianNB() clf.fit(X, Y) При запуске программы показывает...
7674 просмотров

В чем разница между динамическим наивным байесовским классификатором и наивным байесовским классификатором
В настоящее время я использую HMM для прогнозирования солнечной радиации. Традиционная модель HMM может учитывать только данные одной последовательности наблюдений. Однако, когда я использую выборку Гиббса для оценки скрытых состояний,...
542 просмотров

Обучение наивному байесовскому классификатору Stanford-NLP
как часть понимания Стэнфордского nlp API для классификации, я тренирую наивный байесовский классификатор на очень простом тренировочном наборе (3 метки => ['счастливый', 'грустный', 'нейтральный']). Этот набор обучающих данных happy happy...
302 просмотров
schedule 12.01.2023

Есть ли ограничение на количество классов в mlib NaiveBayes? Ошибка при вызове model.save()
Я пытаюсь обучить модель прогнозированию категории текстовых входных данных. Я сталкиваюсь с численной нестабильностью, используя классификатор pyspark.ml.classification.NaiveBayes для набора слов, когда количество классов превышает определенное...
577 просмотров