Doc2Vec vs Avg Word Vectors: что лучше для анализа настроений?

Я выполнял анализ настроений для набора данных IMdb на Kaggle. Я использовал подход BOW с биграммами, и это дало мне приличную точность ~ 89%. Но я не знаю, как подойти к тому же с помощью встраивания слов: мне следует использовать усредненные векторы слов или doc2vec?

Кто-нибудь, пожалуйста, помогите. Заранее спасибо.

mrc_03 25.12.2018 источник

Ответы (1)

arrow_upward
1
arrow_downward

Вот недавнее сообщение в блоге, в котором сравнивается усреднение word2vec против производительности doc2vec. Сообщение одобрено doc2vec. Это также зависит от того, какую модель классификации вы используете (логистическая регрессия, SVM, LSTM и т. Д.).

Adnan S 26.12.2018

comment

Спасибо. Это было очень полезно. - mrc_03; 28.12.2018

Doc2Vec vs Avg Word Vectors: что лучше для анализа настроений?

Ответы (1)

Похожие вопросы