модель гауссовой смеси вероятностей Matlab

У меня есть данные размером 50x100000. (100000 функций, каждая имеет размерность 50).

Я хотел бы подогнать модель гауссовой смеси, используя эти данные. Я использовал следующий код.

               obj = gmdistribution.fit(X',3);

Что мне нужно, так это то, что когда я даю новые данные Y, я должен иметь возможность получить вероятности правдоподобия $p(Y|\theta)$, где $\theta$ — параметры модели гауссовской смеси.

Я использовал следующий код, чтобы получить значения вероятности.

               P = pdf(obj,X');

Но я получаю очень низкие значения, все около 0. Почему это происходит? Как я могу получить соответствующие значения вероятности?


person user570593    schedule 14.06.2013    source источник
comment
Когда вы говорите, что ваши данные имеют размерность 50x100000, вы имеете в виду, что у вас есть 100000 векторов длины 50 и что вы ищете смесь многомерных нормальных распределений, т.е. каждое распределение в смеси является многомерным нормальным распределением для вектор длины 50?   -  person Stochastically    schedule 14.06.2013


Ответы (1)


В одном измерении максимальное значение PDF распределения Гаусса равно 1/sqrt(2*PI). Таким образом, в 50 измерениях максимальное значение будет 1/(sqrt(2*PI)^50), что составляет около 1E-20. Таким образом, все значения PDF будут того же порядка или меньше.

person Stochastically    schedule 14.06.2013
comment
Спасибо за ответ. при чем здесь ПИ? Я планирую создать классификатор, чтобы отбрасывать выбросы из значений вероятности. Я изучаю это распределение на основе одного класса данных. В моем случае, как я могу построить классификатор на основе значений вероятности? - person user570593; 14.06.2013
comment
PI — 3,14159 и т. д. sqrt — функция извлечения квадратного корня. Я думаю, что, вероятно, ответил на ваш первоначальный вопрос, поэтому, если вы согласны, вы можете отметить этот ответ как полезный и/или принятый. Если вы опубликуете еще один вопрос, связанный с тем, как создать свой классификатор, я обязательно посмотрю и опубликую ответ на ваш новый вопрос, если смогу. К вашему сведению, я всегда просматриваю все вопросы с тегом probability. - person Stochastically; 14.06.2013
comment
Спасибо за ответ. Я разместил новый вопрос по адресу stackoverflow.com/questions/17113387/ ждет вашего ответа. :-) - person user570593; 14.06.2013