Вопросы по теме 'gensim'

LSI с использованием gensim в python
Я использую библиотеку Python gensim для скрытой семантической индексации. Я следил за инструкциями на веб-сайте, и это работает очень хорошо. Теперь я пытаюсь немного его изменить; Я хочу запускать модель lsi каждый раз, когда добавляется...
7226 просмотров
schedule 16.09.2023

Eclipse + PyDev ImportError
Мне не удается заставить PyDev в Eclipse распознавать установленные модули ( gensim ), которые нормально работают в IDLE. Я использую 32-разрядную Windows Vista. Python 2.7. Мне задали этот вопрос: здесь , здесь , здесь и здесь ....
4744 просмотров
schedule 07.05.2024

Тематический текст и сходство пользователей
Я пытаюсь вычислить сходство между пользователями и текстовыми документами, используя их тематические представления. т.е. каждый документ и пользователь представлены вектором тем (например, нейронауки, технологии и т. д.) и тем, насколько эта тема...
1275 просмотров

Работа с .bin файлами google word2vec в gensim python
Я пытаюсь начать с загрузки предварительно обученных .bin-файлов с сайта google word2vec (freebase-vectors-skipgram1000.bin.gz) в реализацию word2vec gensim. Модель загружается нормально, с использованием .. model =...
3104 просмотров
schedule 06.06.2022

Что означает дословный синтаксис в Python?
Я вижу следующий фрагмент скрипта на учебной странице Gensim . Каков синтаксис слово в слово в приведенном ниже скрипте Python? >> texts = [[word for word in document.lower().split() if word not in stoplist] >> for...
3238 просмотров
schedule 19.10.2023

Существуют ли какие-либо эффективные библиотеки Python для динамических тематических моделей, предпочтительно расширяющие Gensim?
Я пытаюсь смоделировать данные потока твиттера с помощью тематических моделей. Gensim, будучи простым в использовании решением, впечатляет своей простотой. Он имеет действительно онлайн-реализацию для LSI, но не для LDA. Для изменяющегося потока...
3593 просмотров

tf-idf и LDA в Google App Engine
У меня есть код Python, который использует библиотеки sklearn и gensim для tf-idf и LDA (скрытое распределение Дирихле). Теперь, когда я хочу перейти на механизм приложений Google, я не могу использовать ни одну из этих двух библиотек, потому что они...
483 просмотров

Сложность установки Gensim с использованием исходного кода и pip
Я пытаюсь установить Gensim, который я скачал с этого сайта. Установка с использованием pip у меня тоже не работает. Я получаю сообщение об ошибке ниже. C:\Users\Anirudh\Downloads\gensim-0.10.3>python setup.py install running install...
1440 просмотров
schedule 05.06.2022

Использование Doc2Vec от gensim для создания векторов предложений
Я пытаюсь использовать Doc2Vec для чтения файла, который представляет собой список таких предложений: The elephant flaps its large ears to cool the blood in them and its body. A house is a permanent building or structure for people or families to...
1474 просмотров
schedule 18.11.2022

вероятностный вывод word2vec
Я новичок в мире word2vec и только начинаю использовать реализацию gensim для word2vec. Я использую два наивных предложения в качестве моего первого набора документов, [['first', 'sentence'], ['second', 'sentence']] Я получаю такие...
70 просмотров
schedule 12.07.2023

пропорции темы в моем корпусе?
Спасибо, что прочитали и нашли время подумать и ответить на это. Я использую оболочку Gensim для Mallet ( ldamallet.py ), и это работает как шарм. Мне нужно получить пропорции темы для моего корпуса (по всем моим документам), и я не знаю, как это...
283 просмотров
schedule 10.08.2023

Генератор не итератор?
У меня есть генератор (функция, которая выдает данные), но при попытке передать его gensim.Word2Vec я получаю следующую ошибку: TypeError: вы не можете передать генератор в качестве аргумента предложения. Попробуйте итератор. Разве...
6090 просмотров
schedule 24.02.2022

LDA для тегов (gensim)
Я использую пакет Gensim для моделирования тем. Идея состоит в том, чтобы понять, какие темы указаны в тегах flickr. До сих пор я использую этот код (документ - это теги): texts = [[word for word in document.split(";") if word not in...
935 просмотров
schedule 31.08.2022

Простое руководство по инструменту, поддерживающему классификацию текста, кластеризацию и моделирование тем.
Что такое инструмент для анализа текста с простыми учебными пособиями и активным сообществом? Я нашел несколько популярных, но не уверен, с чего начать.
234 просмотров

Как получить векторы слов из gensim Doc2Vec?
Я обучил модель gensim.models.doc2vec.Doc2Vec d2v_model = Doc2Vec (предложения, size = 100, window = 8, min_count = 5, worker = 4), и я могу получить векторы документов с помощью docvec = d2v_model.docvecs [0 ] Как я могу получить векторы слов из...
7353 просмотров
schedule 20.02.2022

Получите наиболее похожие слова, учитывая вектор слова (а не само слово)
Используя библиотеку gensim.models.Word2Vec , у вас есть возможность предоставить модель и «слово», для которого вы хотите найти список наиболее похожих слов: model = gensim.models.Word2Vec.load_word2vec_format(model_file, binary=True)...
29273 просмотров
schedule 02.07.2022

Расчет тематического распределения невидимого документа на GenSim
Я пытаюсь использовать модуль LDA GenSim для выполнения следующей задачи «Обучите модель LDA с помощью одного большого документа и отслеживайте 10 скрытых тем. Получив новый, невидимый документ, спрогнозируйте распределение вероятностей 10 скрытых...
2102 просмотров
schedule 14.01.2023

KeyError: «слово 'word' отсутствует в словаре» в word2vec
Я использую word2vec , корпус вики, который я обучал, что я могу сделать, если слово, которое я ввожу, отсутствует в словаре в word2vec ? Протестируйте немного: model = word2vec.Word2Vec.load('model/' + 'wiki_chinese_word2vec.model')...
9662 просмотров
schedule 22.12.2023

Интерпретация отрицательного сходства Word2Vec от gensim
Например. мы обучаем модель word2vec, используя gensim : from gensim import corpora, models, similarities from gensim.models.word2vec import Word2Vec documents = ["Human machine interface for lab abc computer applications", "A...
7977 просмотров
schedule 03.07.2023

Gensim: В чем разница между word2vec и doc2vec?
Я новичок и не являюсь носителем английского языка, поэтому у меня возникли проблемы с пониманием word2vec и doc2vec Gensim . Я думаю, что оба дают мне несколько слов, наиболее похожих на слово запроса, которое я запрашиваю, most_similar()...
18024 просмотров
schedule 24.02.2023