Вопросы по теме 'seq2seq'

Модель Seq2Seq учится выводить токен EOS (‹\ s›) только после нескольких итераций.
Я создаю чат-бота, обученного Cornell Movie Dialogs Corpus , используя NMT . Я основываю свой код частично на https://github.com/bshao001/ChatLearner и https://github.com/chiphuyen/stanford-tensorflow-tutorials/tree/master/assignments/chatbot...
1848 просмотров

Как использовать оценку BLEU для сравнения вашей модели с существующими моделями?
Поэтому я использую показатель BLEU для сравнения производительности моей модели NMT с существующими моделями. Однако мне интересно, сколько настроек мне нужно, чтобы сопоставить с другими моделями. Я думаю, что такие настройки, как наборы...
385 просмотров
schedule 29.07.2022

Word2Vec с POS не дает ожидаемых результатов?
Я пытаюсь оценить влияние части речевой информации с помощью вложений Word2Vec, но не получаю ожидаемых результатов. Я ожидал, что POS, включающий в себя вложения word2vec, будет лучше работать в задаче машинного перевода, но на самом деле он...
187 просмотров
schedule 21.02.2022

интерпретация get_weight в модели LSTM в keras
Это мой простой воспроизводимый код: from keras.callbacks import ModelCheckpoint from keras.models import Model from keras.models import load_model import keras import numpy as np SEQUENCE_LEN = 45 LATENT_SIZE = 20 VOCAB_SIZE = 100 inputs =...
442 просмотров
schedule 25.05.2023

слой встраивания выводит nan
Я пытаюсь изучить модель seq2seq. Слой внедрения находится в кодировщике и иногда после некоторых итераций выводит значение nan. Я не могу определить причину. Как я могу это решить ?? Проблема заключается в первом emb_layer в функции forward в...
950 просмотров

InvalidArgumentError в модели декодера во время вывода, для Seq2Seq на основе LSTM в Tensorflow 2.0
версии : Python 3.6.9, Tensorflow 2.0.0, CUDA 10.0, CUDNN 7.6.1, версия драйвера Nvidia 410.78. Я пытаюсь перенести модель Seq2Seq tf.keras на основе LSTM на tensorflow 2.0 Прямо сейчас я сталкиваюсь со следующей ошибкой, когда пытаюсь...
180 просмотров
schedule 04.02.2022

FairSeq — взвешивание потерь образца
Я пытаюсь изучить модель seq2seq с помощью Fairseq. Я хочу иметь разное взвешивание потерь для каждого образца, чтобы были примеры, которые модель будет пытаться лучше подогнать. Как правильно это сделать? Может быть, лучшие библиотеки для этой цели?
50 просмотров
schedule 15.11.2023

ValueError: имя input_2 используется в модели 2 раза. Все имена слоев должны быть уникальными. Ошибка в keras с моделью seq2seq
Пишу чат-бот на питоне с помощью библиотеки Keras и модели Seq2Seq. Сначала я обучаю модель, а затем сохраняю ее в файл .h5 и загружаю из этого файла, чтобы использовать обученную модель. Однако, когда я пытаюсь загрузить свою модель из файла .h5, я...
280 просмотров
schedule 16.09.2023

Указание предложения в задачах нейронного машинного перевода
Я видел много людей, работающих над нейронным машинным переводом. Обычно они представляют свое предложение между тегами <BOS><EOS> , <START><END> и т. д. перед обучением сети. Конечно, указывать начало и конец предложения...
50 просмотров