Вопросы по теме 'naivebayes'
Взвешенный наивный байесовский классификатор в Apache Mahout
Я использую наивный байесовский классификатор для анализа настроений в отношении поддержки клиентов. Но, к сожалению, у меня нет огромных наборов аннотированных данных в области поддержки клиентов. Но у меня есть небольшое количество аннотированных...
983 просмотров
schedule
31.03.2022
Реализация классификатора Bag-of-Words Naive-Bayes в NLTK
В основном у меня есть тот же вопрос как этот парень .. пример в книге NLTK для наивного байесовского классификатора рассматривает только то, встречается ли слово в документе как характеристику. слов»).
Один из ответов предполагает, что это...
25654 просмотров
schedule
17.02.2024
Используйте наивный байесовский подход для числовых атрибутов
Можем ли мы использовать наивный байесовский метод для классификации числовых данных. У нас есть система, которая извлекает стили авторов, такие как длина предложения, длина слова, и использует их для прогнозирования авторства анонимных документов....
1511 просмотров
schedule
12.11.2023
Невозможно использовать Pandas и NLTK для обучения Naive Bayes (машинное обучение) в Python
Вот что я пытаюсь сделать. У меня есть CSV. файл со столбцом 1 с именами людей (например, «Майкл Джордан», «Андерсон Сильва», «Мухаммад Али») и столбцом 2 с этнической принадлежностью людей (например: англичане, французы, китайцы).
В моем коде я...
874 просмотров
schedule
21.02.2023
Классификатор NaiveBayes: нужно ли объединять все файлы одного класса?
Я реализую простой наивный байесовский классификатор, но не понимаю, как правильно рассчитать условную вероятность класса (P(d|c)) . Просто для полноты я хотел бы коротко пояснить используемую терминологию. Наивные байесовские вероятности...
85 просмотров
schedule
27.05.2024
Как создать обучающий файл для Spark MLlib Naive Bayes и рассчитать TF–IDF
Мне нужно классифицировать множество продуктов в дереве категорий, я тестирую Spark и Mlib Naive Bayes. Но я не понимаю, как я могу рассчитать TF-IDF.
У меня есть файл тренера, как это:
#filenameTrainer:
103,355 4 50 60 71 72 66 73 57 53...
295 просмотров
schedule
06.07.2023
Как получить вероятности (вместо одного фактического класса) из NaiveBayesModel в MLlib?
Я построил NaiveBayesModel в MLlib. Он отлично работает, но я хотел бы вернуть вероятности каждого класса для заданного ввода вместо окончательного и единственного решения модели, то есть, относится ли ввод к классу 1.0 или классу 0.0. Любые идеи?
221 просмотров
schedule
24.12.2023
Наивный Байес в R, библиотека e1071: подобранная модель дает априорные вероятности в качестве прогнозов для каждой записи
Я использую Naive Bayes из библиотеки e1071. У меня есть следующий игрушечный набор данных с именем nb0.csv
N_INQUIRIES_BIN,TARGET
1,0
2,1
2,0
1,0
1,0
1,0
1,1
Затем я использую следующие строки кода
library(e1071)
data =...
1356 просмотров
schedule
11.12.2022
Использование платформы Datumbox для машинного обучения с открытым исходным кодом
Я работаю в интеллектуальном новостном приложении для Android, приложение должно извлекать темы новостей, содержащие определенные ключевые слова, из опубликованных новостей в Интернете, а затем классифицировать их по категориям, я понятия не имею, как...
436 просмотров
schedule
15.04.2022
недопустимый тип (символ) аргумента
Это сообщение об ошибке в теме. Я получаю эту ошибку, когда пытаюсь запустить классификатор naive.bayes. Вот сводка моих данных о поездах:
'data.frame': 7269 obs. of 193 variables:
$ pid : int 2 4 5 7 10 11 14 18 25 31 ...
$ acquir...
7354 просмотров
schedule
10.03.2024
Оставьте One Out Scores 100%, что мне здесь не хватает?
Я пытаюсь выполнить одно резюме для своих статей, но когда я запускаю процедуру, я получаю 100% точность и не могу понять, что мне не хватает. Это мой код:
import sklearn
from sklearn.datasets import load_files
import numpy as np
from...
830 просмотров
schedule
10.07.2023
Как сократить время классификации темы в наивном байесовском классификаторе textblob
Я использую pickle для сохранения классифицированной модели с помощью теоремы Байеса, я сохранил файл размером 2,1 ГБ после классификации с 5600 записями. но когда я загружаю этот файл, это занимает почти 2 минуты, но для классификации некоторого...
246 просмотров
schedule
15.07.2022
Получение условных вероятностей для наивной байесовской модели, разработанной с использованием пакета вставки в R
Мой главный вопрос такой:
Как получить условные вероятности для наивной байесовской модели с помощью пакета caret в R?
Фон:
Я запустил наивную байесовскую модель с использованием пакета caret в R. Набор данных по сути представляет собой...
249 просмотров
schedule
28.05.2023
Как я могу создать массив матриц из одной матрицы, используя первый столбец в качестве индекса?
Предположим, у меня есть следующая матрица,
1 2 3 4 5 6 7 8
2 3 4 5 6 7 8 1
3 4 5 6 7 8 1 2
4 5 6 7 8 1 2 3
1 8 7 6 5 4 3 2
2 7 6 5 4 3 2 9
3 6 5 4 3 2...
80 просмотров
schedule
11.12.2023
Сбалансированный корпус для наивного байесовского классификатора
Я работаю с анализом настроений с использованием классификатора NB . Я нашел информацию (блоги, руководства и т. Д.) О том, что корпус обучения должен быть сбалансированным:
33,3% положительных;
33,3% Нейтрально
33,3% отрицательно
Мой...
327 просмотров
schedule
12.12.2023
Производительность: повышение точности наивного байесовского классификатора
Я работаю над простым наивным байесовским текстовым классификатором, который использует Коричневый корпус для тестовых и обучающих данных. Пока что я получил точность 53% при использовании простого подхода без какой-либо предварительной обработки....
715 просмотров
schedule
04.04.2024
sklearn (неверная форма ввода) ValueError
Я новичок в мире ML и sklearn. Я пытался использовать GaussianNB для набора данных с X_train[2500,800] , Y_train[2500,8] .
from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
clf.fit(X, Y)
При запуске программы показывает...
7674 просмотров
schedule
29.05.2023
В чем разница между динамическим наивным байесовским классификатором и наивным байесовским классификатором
В настоящее время я использую HMM для прогнозирования солнечной радиации.
Традиционная модель HMM может учитывать только данные одной последовательности наблюдений.
Однако, когда я использую выборку Гиббса для оценки скрытых состояний,...
542 просмотров
schedule
09.10.2022
Обучение наивному байесовскому классификатору Stanford-NLP
как часть понимания Стэнфордского nlp API для классификации, я тренирую наивный байесовский классификатор на очень простом тренировочном наборе (3 метки => ['счастливый', 'грустный', 'нейтральный']). Этот набор обучающих данных
happy happy...
302 просмотров
schedule
12.01.2023
Есть ли ограничение на количество классов в mlib NaiveBayes? Ошибка при вызове model.save()
Я пытаюсь обучить модель прогнозированию категории текстовых входных данных. Я сталкиваюсь с численной нестабильностью, используя классификатор pyspark.ml.classification.NaiveBayes для набора слов, когда количество классов превышает определенное...
577 просмотров
schedule
14.01.2023