Распределения ключевых слов Java Mallet LDA

Я использовал API Java-Mallet для моделирования тем с помощью LDA. API дает следующие результаты: тема: ключевое слово1 (количество), ключевое слово2 (количество)

Например

тема 0: файл (12423), тест (3123)... тема 1: класс (2415), тест (314)...

Верно ли, что тема 0 = файл (12423/12423+3123 ....), тест(3123/12423+3123).


person Ahmet Samet Şahin    schedule 27.02.2020    source источник


Ответы (1)


Это один из способов оценки вероятностей. Вы также можете добавить параметр сглаживания (обычно 0,01) к каждому значению и добавить к знаменателю 0,01, умноженное на размер словаря, чтобы получить в сумме 1,0.

person David Mimno    schedule 28.02.2020