Вопросы по теме 'mahout'

Развертывание Mahout в кластере Hadoop
Я хочу запустить пример Mahout K-Means в кластере Hadoop из 5 машин. Какие jar-файлы Mahout мне нужно хранить на всех узлах, чтобы K-Means выполнялся распределенным образом. Спасибо. -Венкирам
1332 просмотров
schedule 26.06.2022

Кластеризация Mahout K-means дает мне результат, как будто 0 принадлежит кластеру 1.0: []
Я запустил алгоритм кластеризации K-средних для набора файлов последовательности. Однако сгенерированный результат выглядит следующим образом: 0 принадлежит кластеру 1.0: [] 0 принадлежит кластеру 1.0: [] 0 принадлежит кластеру 1.0: [] 0...
1174 просмотров
schedule 14.01.2023

Hadoop, альтернатива обработке в реальном времени Mahout
Я намеревался использовать хауоп в качестве «вычислительного кластера» в своем проекте. Однако потом я прочитал, что Hadoop не предназначен для систем реального времени из-за накладных расходов, связанных с запуском задания. Я ищу решение, которое...
5548 просмотров
schedule 30.04.2024

Взвешенный наивный байесовский классификатор в Apache Mahout
Я использую наивный байесовский классификатор для анализа настроений в отношении поддержки клиентов. Но, к сожалению, у меня нет огромных наборов аннотированных данных в области поддержки клиентов. Но у меня есть небольшое количество аннотированных...
983 просмотров

Как получить k похожих товаров с помощью Mahout?
У меня есть один продукт, скажем, книга. Теперь я хочу получить k продуктов, похожих на этот продукт. Как я могу сделать это с помощью Mahout? Продукты хранятся в базе данных MySQL, поэтому я бы использовал JDBCDataModel. Для вычисления сходства...
934 просмотров
schedule 16.03.2022

Apache Mahout Math VectorWritable отсутствует в 0.6?
Я работаю над кластеризацией kmeans с помощью Mahout. Однако похоже, что kmeans Mahout не поддерживает файл CSV, тогда я пытаюсь написать генератор файлов определенной последовательности. Странно то, что я пытаюсь использовать класс...
472 просмотров
schedule 25.04.2023

Почему функция LogLikelihoodSimilarity возвращает значения больше 1,0 для набора данных, состоящего из 0 и 1?
У меня есть большой набор данных о предпочтениях, которые выражены как 1.0, и я использую функции сходства Tanimoto и общие логические рекомендации по предпочтениям пользователей и предметов. Рекомендации обычно представляют собой значения от 0 до...
485 просмотров

Mahout — FileDataModel: удалить файлы после обновления?
Я использую FileDataModel в качестве DataModel для рекомендаций в Mahout. Сначала я создаю базовый файл (например, prefs.txt). Время от времени происходят некоторые изменения, которые записываются в файлы обновлений (prefs.1.txt, prefs.2.txt,...
725 просмотров

Могу ли я подключиться напрямую к выходным данным модели Mahout с помощью других инструментов, связанных с данными?
Мой единственный опыт работы с машинным обучением/интеллектуальным анализом данных связан с использованием служб SQL Server Analysis Services. Используя SSAS, я могу настраивать модели и запускать прямые одноэлементные запросы к ним для таких...
183 просмотров
schedule 14.05.2024

LDA Mahout только одна тема
Я пытаюсь следовать примеру использования LDA для данных Reuters, как указано в книге Mahout In Action. Однако, независимо от того, сколько раз я запускаю его, я всегда получаю только одну тему. Я выполнил команду, как указано: mahout lda -i...
603 просмотров
schedule 18.04.2022

Интеграция Apache Mahout с Apache Hive
Я сохранил свои наборы данных в Apache Hive, но хотел бы использовать Mahout для данных в базе данных Hive. Как мне интегрировать Mahout и Hive, чтобы заставить Mahout читать из базы данных Hive?
653 просмотров
schedule 10.07.2022

Q задание не выполнено mahout ssvd
Я пытаюсь запустить ssvd на некоторых tfidf-векторах в mahout. Когда я запускаю его в коде Java следующим образом (с jar-файлами mahout 0.6), он работает нормально: public static void main(String[] args){...
956 просмотров
schedule 16.03.2024

Сентиментальный анализ с наивной байесовской классификацией с использованием Mahout
Я пытаюсь обучить наивный байесовский классификатор с помощью Mahout. Первое, что мне не совсем понятно, это как должны выглядеть мои тренировочные данные. Мой набор данных состоит из мнения, и если оно положительное или отрицательное (1 для...
2511 просмотров
schedule 17.09.2022

Рекомендатель Mahout MovieLens, где выходные файлы?
Я запускаю mahout Recommender, расположенный в вики-статере mahout, после успешной сборки после команды: mvn exec:java -Dexec.mainClass="org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommenderEvaluatorRunner" -Dexec.args="-i...
417 просмотров
schedule 06.05.2023

Apache Mahout — следует ли использовать его для создания собственного рекомендателя?
Я итеративно создаю пользовательскую рекомендательную систему на основе часто меняющейся вероятностной модели скрытых факторов. Я уже написал некоторый код Java, который реализует модель. Он разлагает матрицу оценок пользовательских элементов на две...
1076 просмотров
schedule 23.02.2022

Как запустить lda с помощью файлов jar в mahout-distribution-0.7
У меня есть несколько файлов jar, а именно mahout-integration-0.7.jar, mahout-math-0.7.jar, mahout-core-0.7.jar, mahout-core-0.7-job.jar, mahout-examples-0.7.jar и mahout-примеры-0.7-job.jar. Как мне запустить LDA, вызвав определенный файл jar,...
363 просмотров
schedule 13.04.2024

Предварительная обработка обучающих данных классификатора mahout
Я тренирую классификатор mahout. Нужно ли мне делать вывод, нижний регистр и удалять стоп-слова в моих обучающих данных, или mahout позаботится об этом как часть процесса обучения. Ниже команда, которую я использую для обучения....
305 просмотров
schedule 19.08.2022

Машина опорных векторов для Java?
Я хотел бы написать «умный монитор» на Java, который отправляет предупреждение каждый раз, когда он обнаруживает возникающие проблемы с производительностью. Мое приложение Java записывает данные в структурированном формате в файл журнала:...
23737 просмотров

java.lang.ClassNotFoundException при запуске примера Бреймана в Mahout
Я пытаюсь запустить пример Бреймана построения леса решений для классификации в Mahout в одной системе (псевдораспределенный режим). Я ссылаюсь на это руководство . У меня нет проблем с первыми двумя шагами учебник, но третий шаг (который...
711 просмотров
schedule 29.03.2022

Как оценить рекомендателя с помощью Mahout/Hadoop
Mahout поставляется с рядом предопределенных классов заданий Hadoop (вещи, производные от AbstractJob). К ним относятся задания по вычислению рекомендаций (RecommenderJob). Mahout также определяет различные RecommenderEvaluator для использования при...
1097 просмотров
schedule 27.02.2022