Doc2Vec vs Avg Word Vectors: что лучше для анализа настроений?

Я выполнял анализ настроений для набора данных IMdb на Kaggle. Я использовал подход BOW с биграммами, и это дало мне приличную точность ~ 89%. Но я не знаю, как подойти к тому же с помощью встраивания слов: мне следует использовать усредненные векторы слов или doc2vec?

Кто-нибудь, пожалуйста, помогите. Заранее спасибо.


person mrc_03    schedule 25.12.2018    source источник


Ответы (1)


Вот недавнее сообщение в блоге, в котором сравнивается усреднение word2vec против производительности doc2vec. Сообщение одобрено doc2vec. Это также зависит от того, какую модель классификации вы используете (логистическая регрессия, SVM, LSTM и т. Д.).

person Adnan S    schedule 26.12.2018
comment
Спасибо. Это было очень полезно. - person mrc_03; 28.12.2018