Публикации по теме 'topic-modeling'


Тематическое моделирование вопросов Quora с LDA и NMF
Тематическое моделирование вопросов Quora с LDA и NMF Скрытое распределение Дирихле, неотрицательная матричная факторизация Алгоритм, который использует Quora для определения тем для вопросов, является проприетарным, поэтому мы не можем точно знать, как они это делают. Однако это не мешает нам попробовать это по-своему. Описание проблемы У Quora есть все эти существующие вопросы, без ярлыков, и им нужно классифицировать их, чтобы они соответствовали следующему этапу..

Улучшение интерпретации тематических моделей
Улучшение интерпретации тематических моделей В моем последнем сообщении в блоге я использовал алгоритмы неотрицательной матричной факторизации (NMF) и латентного распределения Дирихле (LDA), реализованные в замечательной библиотеке Python для машинного обучения Scikit Learn , чтобы найти темы в коллекции документов. Вывод производных тем включал присвоение теме числовой метки и распечатку первых слов в теме. Обычной практикой является просто печатать главные слова для каждой темы -..