Определение метки/выходных данных для временных рядов RNN/LSTM

Допустим, я предсказываю погоду и хочу использовать данные о погоде за 7 дней (состоящие из 5 параметров), чтобы предсказать температуру следующего дня. Таким образом, каждая обучающая партия имеет последовательность из 7 временных шагов (7 дней данных о погоде), чтобы составить данные X, то есть:

[batch_size, 7, 5]

Для данных Y я предполагаю, что предоставляю только 1 значение (8-й день) для каждой последовательности партии, т.е.:

[batch_size, 1]

?


person BigBadMe    schedule 25.06.2018    source источник


Ответы (1)


Чтобы ответить на мой собственный вопрос: это зависит от того, что я пытаюсь смоделировать. Если мне интересно ввести 7 временных шагов для прогнозирования погоды на 8-й день, это классифицируется как моделирование «многие к одному», и мои предлагаемые значения Y верны для этого сценария.

Случай, когда у вас может быть много ко многим, — это языковой перевод, когда каждое слово во входной последовательности переводится в соответствующие слова на выходе.

person BigBadMe    schedule 12.11.2018