[РЕШЕНО]
Моя ошибка заключалась в том, что я не понимал, что энтропия равна 0, если все они одного типа. Таким образом, если все положительные, энтропия равна 0, а если все отрицательные, то она также равна нулю. Энтропия будет равна 1, если одинаковое количество положительных и отрицательных значений.
Не имеет смысла получать отрицательный информационный прирост.
Однако, основываясь на этом примере, я получаю отрицательный прирост информации.
вот данные:
И если я посчитаю прирост информации по атрибуту влажности, я получу следующее:
Очевидно, я что-то здесь упускаю.
РЕДАКТИРОВАТЬ: Чтобы уточнить, как я это понимаю.
Энтропия всей системы определяется как:
Что в данном случае тогда:
Прирост информации на атрибут определяется как:
Что для влажности я рассчитываю на:
Энтропия системы - (1/4)Энтропия влажности Нормальная - (3/4)Энтропия влажности Высокая
Согласно этому Libre Office Calc:
Или мое понимание формулы получения информации для атрибута неверно?