Ввод CSV в gensim LDA через corpora.csvcorpus

Я хочу использовать LDA в gensim для тематического моделирования нескольких тысяч документов. Поэтому я использую csv-файл в качестве входных данных в формате термин-документ-матрица.

В настоящее время возникает ошибка при запуске следующего кода:

from gensim import corpora

import_path ="TDM.csv"

dictionary = corpora.csvcorpus(import_path, labels='true')

Ошибка следующая:

dictionary = corpora.csvcorpus(import_path, labels='true')

AttributeError: module 'gensim.corpora' has no attribute 'csvcorpus'

Правильно ли я использую модуль, и если да, то в чем моя ошибка?

Заранее спасибо.


person Nils_Denter    schedule 14.05.2018    source источник
comment
Я запустил тот же код еще несколько раз, и теперь ошибка изменилась на: dict = corpora.csvcorpus(import_path, labels='true') TypeError: объект 'module' не вызывается. В чем проблема?   -  person Nils_Denter    schedule 15.05.2018


Ответы (1)


Это тоже беспокоило меня довольно долго. Похоже, что csvcorpus на самом деле находится на экспериментальной стадии, как вы можете видеть в их проблеме на github, https://github.com/RaRe-Technologies/gensim/issues/1583

Я бы порекомендовал использовать старомодный способ использования пакета csv для чтения вашего файла csv.

Ваше здоровье.

person Magz    schedule 21.05.2018
comment
Хорошо, спасибо, я уже нашел обходной путь с модулем csv. - person Nils_Denter; 23.05.2018