Моя цель — определить темы твитов и визуализировать, как распределение тем менялось с течением времени. Насколько я знаю, лучше всего это сделать с помощью пакета stm, но у меня есть некоторые проблемы с ним. Итак, мой единственный вариант - сделать простой LDA.
Основываясь на доле тем для каждого из твитов, я суммировал доли тем за год и сравнил долю каждой темы с общей суммой за каждый год (так же, как это делается здесь https://towardsdatascience.com)./thats-mental-using-lda-topic-modeling-to-Investigate-the-discourse-on-mental-health-over-time-11da252259c3). Окончательная визуализация выглядит примерно так: темы с течением времени
Мой вопрос: можно ли визуализировать темы с течением времени с помощью LDA, какой смысл делать это в STM? Есть ли важные отличия?