Публикации по теме 'rnn'


Введение в прогнозирование временных рядов с использованием RNN
В этой истории мы собираемся сделать прогнозирование временных рядов, используя RNN в наборе данных Quandl в Google Collaboratory. Quandl ( https://www.quandl.com ) — набор данных, используемый для финансово-экономического анализа. Чтобы получить доступ к данным Quandl в коде Python, нам нужно установить пакет Python Quandl: !pip install quandl После импорта пакета в код нам нужно установить ключ API, который можно получить на сайте Quandl, создав бесплатную учетную запись. import..

Вопросы по теме 'rnn'

Как интерпретировать эту кривую потерь модели textsum?
Я тренировал textsum seq2seq с моделью внимания для абстрактного обобщения на учебном корпусе из 600 000 статей + рефераты. Можно ли это считать конвергенцией? Если да, то может быть правильно, что он сошёлся меньше, чем, скажем, за 5 тысяч шагов?...
187 просмотров

LSTM с последующим средним пулом (TensorFlow)
Я знаю, что есть похожая тема в LSTM, за которой следует средний пул , но это речь идет о Keras, и я работаю в чистом TensorFlow. У меня есть сеть LSTM, в которой повторение обрабатывается: outputs, final_state = tf.nn.dynamic_rnn(cell,...
1299 просмотров
schedule 18.12.2022

Как RNN работает на Керасе?
Я читал документацию по Keras на их сайте ([ https://keras.io/getting-started/faq/] ), и я заметил, что в их определении партии говорится, что они запускают каждый образец в партии параллельно. Почти для любого типа нейронной сети это было бы вполне...
76 просмотров

Как обучить иерархическую модель в двух частях
Это продолжение следующего вопроса: Запутался в том, как реализовать распределенный по времени LSTM + LSTM Текущая структура черновик работает хорошо: Основная идея заключается в том, что существует глубокий входной слой LSTM...
152 просмотров
schedule 13.06.2022

Как выбрать этикетку / мишень для моделей RNN?
При обучении персонажа RNN, если у нас есть вход X = (x_1, x_2, ..., x_t), мы разбиваем его на две части: X_train = (x_1, x_2, ..., x_ (t-1)) , y_train = (x_2, x_3, ..., x_t). Зачем нам это делать? Почему бы не установить y_train = (x_ (t + 1)),...
913 просмотров

Нет модуля с именем «tqdm»
Я запускаю следующий код рекуррентной нейронной сети (RNN) с использованием Python 3.6. import os import logging import numpy as np from tqdm import trange import tensorflow as tf from utils import * from network import Network from statistic...
119620 просмотров
schedule 07.04.2022

Как моделировать рекуррентные сверточные нейронные сети в Caffe?
Я новичок в фреймворке Caffe, только недавно начал его использовать. Я понимаю, что моделирование CNN разрешено, однако возможно ли объединить RNN (не большой опыт работы с ними) и CNN вместе, чтобы сформировать рекуррентную сверточную нейронную...
363 просмотров

Пользовательская реализация GRU не работает
Я создал пользовательскую реализацию GRU в TensorFlow для экспериментов. При обучении он ничем не отличается от родного TensorFlow GRUcell. Я пытаюсь понять, почему, и просто не могу. Любой вклад будет оценен. Нативная реализация: encoder...
101 просмотров
schedule 06.08.2023

Как нормализовать вероятности слов в предложениях разной длины?
Допустим, у нас есть модель RNN, которая выводит вероятность слова с учетом контекста (или без контекста), обученного на корпусе. Мы можем связать вероятность каждого слова в последовательности, чтобы получить общую вероятность самого предложения....
1190 просмотров

Простой пример реализации RNN на основе CuDnnGRU в Tensorflow
Я использую следующий код для стандартной реализации GRU: def BiRNN_deep_dynamic_FAST_FULL_autolength(x,batch_size,dropout,hidden_dim): seq_len=length_rnn(x) with tf.variable_scope('forward'): lstm_cell_fwd...
4960 просмотров
schedule 06.04.2022

Что такое num_unit в ячейке LSTM?
Я очень старался искать везде, но не смог найти, что такое num_units в TensorFlow на самом деле. Я попытался связать свой вопрос с этим вопросом , но не смог т получить четкое объяснение там. В TensorFlow при создании RNN на основе LSTM мы...
2352 просмотров
schedule 20.03.2024

Как мы можем определить нейронную сеть RNN-LSTM с несколькими выходами для входа в момент времени t?
Я пытаюсь построить RNN, чтобы предсказать возможность того, что игрок будет играть в матче, а также счет прогонов и калитки, взятые игроком. Я бы использовал LSTM, чтобы производительность в текущем матче влияла на будущий выбор игрока. Обзор...
65 просмотров
schedule 18.06.2023

Keras: невозможно продолжить обучение загруженной модели
Я сохранил модель RNN (GRU) с помощью model.save, но когда я запускаю функцию подгонки после загрузки модели, она искажает мои веса и дает неверные прогнозы. Однако я получаю правильные прогнозы, когда прогнозирую без запуска функции подгонки....
637 просмотров

Какими должны быть входные данные для модели «Декодер последовательности к последовательности»?
Я разрабатываю модель последовательностей ( бумага ) для генерации текста. Я не использую «принудительную работу учителя» на стороне декодера, т. е. вывод декодера в момент t0 подается на вход декодера в момент времени t1 . Теперь, в...
108 просмотров

Какой тип нейронной сети может обрабатывать переменные входные и выходные размеры?
Я пытаюсь использовать подход, описанный в этом документе https://arxiv.org/abs/1712.01815 чтобы алгоритм научился новой игре. Есть только одна проблема, которая напрямую не укладывается в этот подход. Игра, которую я пытаюсь изучить, не имеет...
3931 просмотров

Определение метки/выходных данных для временных рядов RNN/LSTM
Допустим, я предсказываю погоду и хочу использовать данные о погоде за 7 дней (состоящие из 5 параметров), чтобы предсказать температуру следующего дня. Таким образом, каждая обучающая партия имеет последовательность из 7 временных шагов (7 дней...
20 просмотров
schedule 26.11.2023

Как сделать прогноз времени RNN на несколько дней с помощью Keras?
В настоящее время я работаю над программой, которая будет использовать данные об акциях за предыдущие 4000 дней по конкретной акции и предсказывать результаты на следующие 90 дней. Я решил сделать это с помощью RNN, которая использует слои LSTM для...
283 просмотров
schedule 15.06.2022

Понимание потерь/точности модели и как не допустить утечки информации
Этот вопрос связан с начальным, опубликованным здесь . Проблема состоит в том, чтобы классифицировать строки так, чтобы классификация строки с номером i могла опираться на данные для всех предыдущих строк, включая принадлежность к классу....
37 просмотров
schedule 26.01.2024

Как загрузить 2D-данные в LSTM в pytorch
У меня есть серия синусоидальных волн, которые я загрузил с помощью специального загрузчика данных. Данные преобразуются в тензор факела с помощью from_numpy. Затем я пытаюсь загрузить данные с помощью перечислителя через train_loader. Итератор...
2366 просмотров
schedule 24.05.2023

keras: объекты-тензор не повторяются, если неактивное выполнение не включено
Я пишу модель от последовательности к последовательности в Керасе. По какой-то причине, когда я пытаюсь определить модель в функции ниже: def define_GRU_models(encoder_input_dim, output_dim, activation,...
4266 просмотров