Проблемы с PYMC MAP Fit

Я использую PyMC для реализации пары мультином-дирихле. Я хочу отобразить модель для всех экземпляров, которые у нас есть. Проблема, с которой я сталкиваюсь, заключается в том, что после MAP.fit() предыдущее распределение изменяется. Таким образом, для каждого нового экземпляра мне нужно иметь новый предыдущий дистрибутив, что должно быть в порядке. Однако я продолжаю видеть эту ошибку:

Traceback (most recent call last):
  File "/Users/xingweiy/Project/StarRating/TimePlot/BayesianPrediction/DiricheletMultinomialStarRating.py", line 41, in <module>
    prediction = predict.predict(input,prior)
  File "/Users/xingweiy/Project/StarRating/TimePlot/BayesianPrediction/predict.py", line 12, in predict
    likelihood = pm.Categorical('rating',prior,value = exp_data,observed = True)
  File "/Library/Python/2.7/site-packages/pymc-2.3.4-py2.7-macosx-10.9-intel.egg/pymc/distributions.py", line 3170, in __init__
    verbose=verbose, **kwds)
  File "/Library/Python/2.7/site-packages/pymc-2.3.4-py2.7-macosx-10.9-intel.egg/pymc/PyMCObjects.py", line 772, in __init__
    if not isinstance(self.logp, float):
  File "/Library/Python/2.7/site-packages/pymc-2.3.4-py2.7-macosx-10.9-intel.egg/pymc/PyMCObjects.py", line 929, in get_logp
    raise ZeroProbability(self.errmsg)
pymc.Node.ZeroProbability: Stochastic rating's value is outside its support,
 or it forbids its parents' current values.

Вот код:

alpha= np.array([0.1,0.1,0.1,0.1,0.1])
prior = pm.Dirichlet('prior',alpha)
exp_data = np.array(input)
likelihood = pm.Categorical('rating',prior,value = exp_data,observed = True)
MaximumPosterior = inf.inference(prior, likelihood, exp_data)

def inference(prior,likelihood,observation):
    model = Model({'likelihood':likelihood,'prior':prior})
    M = MAP(model)
    M.fit()
    result = M.prior.value
    result = np.append(result,1- np.sum(M.prior.value))
    return result

Я думаю, что это ошибка пакета pymc. Есть ли способ сделать MAP без изменения предыдущего дистрибутива?

Спасибо

Ответ по ссылке ниже решил мою проблему:

https://groups.google.com/forum/#!topic/pymc/uYQSGW4acf8


person user2547081    schedule 14.04.2015    source источник
comment
Не могли бы вы показать ввод вашей модели?   -  person FuzzyDuck    schedule 14.04.2015
comment
Это просто список целых чисел, например. [1,5,1,5,3,4]. Каждый экземпляр представляет собой список целых чисел от 1 до 10. Но размер списка может быть другим.   -  person user2547081    schedule 14.04.2015
comment
Кстати, если бы я не предоставлял новый априор для каждого экземпляра, программа могла бы работать без проблем. Однако результаты неверны, поскольку предыдущее распределение изменяется после MAP.fit().   -  person user2547081    schedule 14.04.2015
comment
Нам будет проще воспроизвести вашу ошибку, если вы покажете полный код.   -  person FuzzyDuck    schedule 14.04.2015


Ответы (1)


По сути, распределение Дирихле генерирует вероятность, близкую к 0.

Ссылка ниже решила мою проблему: https://groups.google.com/forum/#!topic/pymc/uYQSGW4acf8

person user2547081    schedule 14.04.2015