Я собираюсь обучить нейронную сеть (например, сеть с прямой связью), в которой на выходе будет просто действительное значение, представляющее вероятность (и, следовательно, в интервале [0, 1]). Какую функцию активации следует использовать для последнего уровня (т. е. выходного узла)?
Если я не использую никаких функций активации и просто вывожу tf.matmul(last_hidden_layer, weights) + biases
, это может привести к некоторым отрицательным результатам, что неприемлемо, поскольку выходы являются вероятностями, и поэтому прогноз также должен быть вероятностью. Если я использую tf.nn.softmax
или tf.nn.softplus
, модель всегда возвращает 0 в тестовом наборе. Любое предложение?