В настоящее время я использую FastText, чтобы получить вложения слов для некоторых входных текстовых данных, чтобы уловить сходство между ними и передать их в качестве входных данных в нейронную сеть для задачи NER. Сначала я попытался использовать файл fastText .vec, и мне удалось получить от них хороший результат сходства, затем я попытался использовать файл модели .bin, чтобы я мог получать вложения также из терминов вне словарного запаса но я заметил, что векторы, созданные из файлов .vec и .bin, отличаются. Файл .vec содержит вложения, обрезанные до диапазона [-1,1], в то время как это неверно для вложений, содержащихся в файле .bin. Используя файл .bin, я получаю очень плохие результаты, поэтому я пытаюсь понять, связано ли это с тем, что эти векторы (.bin) не нормализованы.
Есть ли хороший способ нормализовать эти векторы в диапазоне [-1, 1] с помощью Python?
Заранее спасибо.