Я пытаюсь реализовать алгоритм Метрополиса-Гастингса для простой линейной регрессии на C (без использования других библиотек (boost, Eigen и т.д.) и без двумерных массивов)*. Для лучшего тестирования кода/оценки графиков трассировки я переписал код для R (см. ниже), сохранив как можно больше C-кода.
К сожалению, цепочки не сходятся. мне интересно, если
- ошибка в самой реализации?
- "просто" неудачный выбор дистрибутивов предложений?
Предполагая последнее, я думаю о том, как найти хорошие параметры распределения предложений (в настоящее время я выбрал произвольные значения), чтобы алгоритм работал. Даже с тремя параметрами, как в данном случае, найти подходящие параметры довольно сложно. Как обычно решают эту проблему, если, скажем, выборка Гиббса не является альтернативой?
*Я хочу использовать этот код для Cuda
#### posterior distribution
logPostDensity <- function(x, y, a, b, s2, N)
{
sumSqError = 0.0
for(i in 1:N)
{
sumSqError = sumSqError + (y[i] - (a + b*x[i]))^2
}
return(((-(N/2)+1) * log(s2)) + ((-0.5/s2) * sumSqError))
}
# x = x values
# y = actual datapoints
# N = sample size
# m = length of chain
# sigmaProp = uniform proposal for sigma squared
# paramAProp = uniform proposal for intercept
# paramBProp = uniform proposal for slope
mcmcSampling <- function(x,y,N,m,sigmaProp,paramAProp,paramBProp)
{
paramsA = vector("numeric",length=m) # intercept
paramsB = vector("numeric",length=m) # slope
s2 = vector("numeric",length=m) # sigma squared
paramsA[1] = 0
paramsB[1] = 0
s2[1] = 1
for(i in 2:m)
{
paramsA[i] = paramsA[i-1] + runif(1,-paramAProp,paramAProp)
if((logPostDensity(x,y,paramsA[i],paramsB[i],s2[i-1],N)
- logPostDensity(x,y,paramsA[i-1],paramsB[i-1],s2[i-1],N))
< log(runif(1)))
{
paramsA[i] = paramsA[i-1]
}
paramsB[i] = paramsB[i-1] + runif(1,-paramBProp,paramBProp)
if((logPostDensity(x,y,paramsA[i],paramsB[i],s2[i-1],N)
- logPostDensity(x,y,paramsA[i-1],paramsB[i-1],s2[i-1],N))
< log(runif(1)))
{
paramsB[i] = paramsB[i-1]
}
s2[i] = s2[i-1] + runif(1,-sigmaProp,sigmaProp)
if((s2[i] < 0) || (logPostDensity(x,y,paramsA[i],paramsB[i],s2[i],N)
- logPostDensity(x,y,paramsA[i],paramsB[i],s2[i-1],N))
< log(runif(1)))
{
s2[i] = s2[i-1]
}
}
res = data.frame(paramsA,paramsB,s2)
return(res)
}
#########################################
set.seed(321)
x <- runif(100)
y <- 2 + 5*x + rnorm(100)
summary(lm(y~x))
df <- mcmcSampling(x,y,10,5000,0.05,0.05,0.05)
par(mfrow=c(3,1))
plot(df$paramsA[3000:5000],type="l",main="intercept")
plot(df$paramsB[3000:5000],type="l",main="slope")
plot(df$s2[3000:5000],type="l",main="sigma")
prop
) на основе текущей скорости принятия (которую вам придется отслеживать с помощью трех счетчиков). Я думаю, что причина, по которой вы не получаете конвергенцию, заключается в том, что вы не исследуете полное пространство параметров. - person Alexey Shiklomanov   schedule 17.11.2015Prop
для этого параметра на 2. Вот пример реализации. - person Alexey Shiklomanov   schedule 18.11.2015