Асимметрия и эксцесс Python в наивном байесовском классификаторе

Я создаю наивный байесовский классификатор на Python, который сможет угадать, в каком месяце он основан на некоторых погодных данных за один день.

В настоящее время для классификации месяца используются среднее значение и стандартное отклонение, однако я решил, что добавление асимметрии и эксцесса может помочь в повышении точности.

В настоящее время я использую scipy.stats.norm.cdf для расчета вероятности, но я не могу найти в Python какой-либо функции cdf, которая учитывала бы асимметрию и эксцесс.

Мне кажется, что я неправильно понимаю асимметрию и эксцесс. Асимметрия и эксцесс влияют на функцию cdf, поэтому я ожидал, что они будут указаны в качестве параметра.

Что-то в корне неверно в моем понимании асимметрии, эксцесса и функции cdf? Если нет, то где я могу найти реализацию функции cdf в Python, которая учитывает все эти параметры?


person Thijs Riezebeek    schedule 27.11.2015    source источник
comment
Возможно, это не решит вашу проблему, но взгляните на: scikit-learn.org/stable /modules/naive_bayes.html   -  person Dietrich    schedule 28.11.2015
comment
В нормальном распределении асимметрия и эксцесс равны нулю, и поэтому вам придется использовать другой вид распределения, если вы хотите каким-то образом определить его на основе этих параметров.   -  person Leandro Caniglia    schedule 28.11.2015


Ответы (1)


Нормальное распределение, которое вы используете (scipy.stats.norm) и которое обычно используется для моделирования одномерного условного распределения в Наивном Байесе, явно определяется всего двумя параметрами - его mean и std. Нет смысла указывать асимметрию / эксцесс, поскольку они постоянны для вашего дистрибутива (в частности, эксцесс равен 3).

Вероятно, вы думаете о распределении Пирсона, которое используется для соответствия большему количеству моментов (среднее значение, стандартное отклонение, асимметрия и эксцесс).

http://docs.scipy.org/doc/scipy-0.15.1/reference/generated/scipy.stats.pearson3.html

person lejlot    schedule 27.11.2015