Я выполнял анализ настроений для набора данных IMdb на Kaggle. Я использовал подход BOW с биграммами, и это дало мне приличную точность ~ 89%. Но я не знаю, как подойти к тому же с помощью встраивания слов: мне следует использовать усредненные векторы слов или doc2vec?
Кто-нибудь, пожалуйста, помогите. Заранее спасибо.