Я работаю над встраиванием слов и немного запутался в количестве измерений вектора слова. Я имею в виду, возьмем в качестве примера word2vec. Мой вопрос в том, почему мы должны использовать, скажем, 100 скрытых нейронов для нашего скрытого слоя? Имеет ли это число какой-либо смысл или логику? или если произвольно, то почему не 300? или 10? почему не больше или меньше? Как мы все знаем, самый простой способ отображения векторов — это двухмерное пространство (только X и Y), зачем больше измерений? Я читал некоторые ресурсы об этом, и в одном примере они выбирают 100 измерений, в другом выбирают другие числа, такие как 150, 200, 80 и т. д.
Я знаю, что чем больше число, тем больше пространство для отображения отношений между словами, но мы не могли отображать отношения в двухмерном векторном пространстве (только X и Y)?! зачем нам больше места? каждое слово отображается вектором, так почему мы должны использовать многомерное пространство, когда мы можем отображать векторы в двух- или трехмерном пространстве? и затем проще использовать методы подобия, такие как косинус, чтобы найти сходство в 2 или 3 измерениях, а не в 100 (с точки зрения времени вычислений), верно?