Я пытался сохранить стабильность результатов тематического моделирования, используя молоток в качестве библиотеки в gensim. Однако я обнаружил, что молоток может устанавливать случайное семя, но я не вижу в gensim никакого параметра для его установки.
Как я могу установить случайное семя модели темы, используя молоток в gensim?
Ответы (2)
Это только что было добавлено в оболочку ldamallet.py.
def __init__(self, mallet_path, corpus=None, num_topics=100, alpha=50, id2word=None, workers=4, prefix=None,
optimize_interval=0, iterations=1000, topic_threshold=0.0, random_seed=0):
"""
Parameters
----------
mallet_path : str
Path to the mallet binary, e.g. `/home/username/mallet-2.0.7/bin/mallet`.
corpus : iterable of iterable of (int, int), optional
Collection of texts in BoW format.
num_topics : int, optional
Number of topics.
alpha : int, optional
Alpha parameter of LDA.
id2word : :class:`~gensim.corpora.dictionary.Dictionary`, optional
Mapping between tokens ids and words from corpus, if not specified - will be inferred from `corpus`.
workers : int, optional
Number of threads that will be used for training.
prefix : str, optional
Prefix for produced temporary files.
optimize_interval : int, optional
Optimize hyperparameters every `optimize_interval` iterations
(sometimes leads to Java exception 0 to switch off hyperparameter optimization).
iterations : int, optional
Number of training iterations.
topic_threshold : float, optional
Threshold of the probability above which we consider a topic.
random_seed: int, optional
Random seed to ensure consistent results, if 0 - use system clock.
"""
person
Chris Palmer
schedule
10.01.2019
У меня была такая же проблема, но использовать последнюю версию gensim
немного сложно. Как сказал Крис, в новой версии он реализован, но запустить его для меня было проблематично. Обязательно сделайте следующее, так как вы можете использовать старую оболочку:
conda install -c conda-forge gensim
pip install --upgrade gensim
Второй шаг выполняет свою работу, и просто его установка не обновит gensim
, поскольку у меня была проблема с ним.
Следующие ссылки содержат дополнительную информацию по вашему вопросу:
person
Habib Karbasian
schedule
19.04.2019