От веса до потери кроссэнтропии

Скажем, у меня есть два класса, класс A (100 образцов) и класс B (100 образцов) в обучении, но во время тестирования класс A имеет (1000 образцов), а класс B (100 образцов). Как я должен рассчитывать и использовать веса для взвешенной потери кросс-энтропии. Я не понимаю, должно ли это быть 0,5, 0,5 или нет. Как я могу представить истинное распределение?


person amy    schedule 25.01.2019    source источник


Ответы (1)


Лучшие настройки обычно не имеют веса.

Очевидно, у вас есть несоответствие между распределением классов (1: 1 против 10: 1). Если вы ничего не можете сделать, установите вес для класса A на 10 и B на 1, чтобы правильно представить окончательное распределение. Их не нужно складывать до 1, и вы можете снизить скорость обучения, если используете высокие значения (это просто множитель для компонента потерь).

Это грубое исправление, правильное - исправить выборку, чтобы у вас был такой же дисбаланс в наборе обучающих входных данных (и они должны соответствовать тому, что вы видите на практике).

Вышеупомянутые вещи неверны, если ошибка в B на практике обходится значительно дороже, чем ошибка в A (т. Е. Отсутствие скачка акций - это просто упущенная возможность, но покупка акций и отсутствие скачка акций стоит ваших денег. ). В этом случае вы хотите иметь более высокий штраф к B.

person Sorin    schedule 25.01.2019
comment
Итак, два вопроса: (A) Если бы я переделал выборку обучающего набора и сделал распределение (10: 1), чтобы представить окончательное распределение, то каковы были бы веса? (B) Какая разница между весами проигрыша и штрафа. Я видел некий классификатор, который ставил более высокие веса и называл их штрафом. Я понимаю, что вы хотите сказать, но как учесть вес и штраф? - person amy; 25.01.2019
comment
Как мне добавить стоимость, когда я теряю кросс-энтропию? - person amy; 27.01.2019