Вопросы по теме 'seq2seq'
Модель Seq2Seq учится выводить токен EOS (‹\ s›) только после нескольких итераций.
Я создаю чат-бота, обученного Cornell Movie Dialogs Corpus , используя NMT .
Я основываю свой код частично на https://github.com/bshao001/ChatLearner и https://github.com/chiphuyen/stanford-tensorflow-tutorials/tree/master/assignments/chatbot...
1848 просмотров
schedule
11.12.2023
Как использовать оценку BLEU для сравнения вашей модели с существующими моделями?
Поэтому я использую показатель BLEU для сравнения производительности моей модели NMT с существующими моделями. Однако мне интересно, сколько настроек мне нужно, чтобы сопоставить с другими моделями.
Я думаю, что такие настройки, как наборы...
385 просмотров
schedule
29.07.2022
Word2Vec с POS не дает ожидаемых результатов?
Я пытаюсь оценить влияние части речевой информации с помощью вложений Word2Vec, но не получаю ожидаемых результатов.
Я ожидал, что POS, включающий в себя вложения word2vec, будет лучше работать в задаче машинного перевода, но на самом деле он...
187 просмотров
schedule
21.02.2022
интерпретация get_weight в модели LSTM в keras
Это мой простой воспроизводимый код:
from keras.callbacks import ModelCheckpoint
from keras.models import Model
from keras.models import load_model
import keras
import numpy as np
SEQUENCE_LEN = 45
LATENT_SIZE = 20
VOCAB_SIZE = 100
inputs =...
442 просмотров
schedule
25.05.2023
слой встраивания выводит nan
Я пытаюсь изучить модель seq2seq. Слой внедрения находится в кодировщике и иногда после некоторых итераций выводит значение nan. Я не могу определить причину. Как я могу это решить ?? Проблема заключается в первом emb_layer в функции forward в...
950 просмотров
schedule
27.04.2023
InvalidArgumentError в модели декодера во время вывода, для Seq2Seq на основе LSTM в Tensorflow 2.0
версии : Python 3.6.9, Tensorflow 2.0.0, CUDA 10.0, CUDNN 7.6.1, версия драйвера Nvidia 410.78.
Я пытаюсь перенести модель Seq2Seq tf.keras на основе LSTM на tensorflow 2.0
Прямо сейчас я сталкиваюсь со следующей ошибкой, когда пытаюсь...
180 просмотров
schedule
04.02.2022
FairSeq — взвешивание потерь образца
Я пытаюсь изучить модель seq2seq с помощью Fairseq. Я хочу иметь разное взвешивание потерь для каждого образца, чтобы были примеры, которые модель будет пытаться лучше подогнать. Как правильно это сделать? Может быть, лучшие библиотеки для этой цели?
50 просмотров
schedule
15.11.2023
ValueError: имя input_2 используется в модели 2 раза. Все имена слоев должны быть уникальными. Ошибка в keras с моделью seq2seq
Пишу чат-бот на питоне с помощью библиотеки Keras и модели Seq2Seq. Сначала я обучаю модель, а затем сохраняю ее в файл .h5 и загружаю из этого файла, чтобы использовать обученную модель. Однако, когда я пытаюсь загрузить свою модель из файла .h5, я...
280 просмотров
schedule
16.09.2023
Указание предложения в задачах нейронного машинного перевода
Я видел много людей, работающих над нейронным машинным переводом. Обычно они представляют свое предложение между тегами <BOS><EOS> , <START><END> и т. д. перед обучением сети. Конечно, указывать начало и конец предложения...
50 просмотров
schedule
12.08.2023