Используя молоток, я могу получить определенное количество тем и их слов. Как я могу убедиться, что тематические слова имеют распределение вероятностей (т.е. сумма до единицы)?
Например, если я запускаю его, как показано ниже, как я могу использовать выходные данные, данные молотком, чтобы убедиться, что вероятности слов темы для темы 0 составляют 1?
mallet train-topics --input text.vectors --output-topic-keys topics.txt --output-doc-topics doc_comp.txt --topic-word-weights-file weights.txt --num-top-words 50 --word-topic-counts-file counts.txt --num-topics 3 --output-state topicstate.gz --alpha 1
(count[topic, word] + alpha / num_word_types) / (sum(count[topic, w] for w in words) + alpha)
. - person senderle   schedule 20.12.2016