При рассмотрении проблемы классификации входа в один из 2 классов, 99% примеров, которые я видел, использовали NN с одним выходом и сигмоидой в качестве их активации с последующей двоичной кросс-энтропийной потерей. Другой вариант, о котором я подумал, - это заставить последний слой производить 2 вывода и использовать категориальную кросс-энтропию с классами C = 2, но я никогда не видел этого ни в одном примере. Есть ли для этого какие-то причины?
Спасибо