Почему word2vec превосходит другие методы нейронной сети?
Word2vec более мелкий, чем другие методы нейронной сети (NNLM, RNNLM и т. д.).
Можно ли это объяснить?
И я хочу знать, есть ли у него какие-либо недостатки, потому что модель word2vec не содержит скрытого слоя (функция активации, такая как сигмоид и т. Д.)?