Итак, у меня есть очень простой скрипт NN, написанный в Tensorflow, и мне трудно отследить, откуда исходит некоторая «случайность».
я записал
- Вес,
- градиенты,
- Логиты
моей сети, когда я тренируюсь, и для первой итерации ясно, что все начинается одинаково. У меня есть значение SEED как для того, как данные считываются, так и значение SEED для инициализации весов сети. Те, кого я никогда не меняю.
Моя проблема в том, что, скажем, на второй итерации каждого повторного запуска, который я делаю, я начинаю видеть, что градиенты расходятся (на небольшую величину, например, 1e-6 или около того). Однако со временем это, конечно, приводит к неповторяемому поведению.
Что может быть причиной этого? Я не знаю, откуда может браться какой-либо возможный источник случайности...
Спасибо