Сначала я подобрал пуассоновский glm в R следующим образом:
> Y<-c(13,21,12,11,16,9,7,5,8,8)
> X<-c(74,81,80,79,89,96,69,88,53,72)
> age<-c(50.45194,54.89382,46.52569,44.84934,53.25541,60.16029,50.33870,
+ 51.44643,38.20279,59.76469)
> dat=data.frame(Y=Y,off.set.term=log(X),age=age)
> fit.1=glm(Y~age+offset(off.set.term),data=dat,family=poisson)
Затем я попытался получить прогнозы ответа (в масштабе журнала) для нового набора данных с помощью функции predict
. Обратите внимание, что я установил смещение равным нулю.
> newdat=data.frame(age=c(52.09374,50.89329,50.61472,39.13358,44.79453),off.set.term=rep(0,5))
> predict(fit.1,newdata =newdat,type="link")
1 2 3 4 5
-1.964381 -1.956234 -1.954343 -1.876416 -1.914839
Затем я попробовал пакет сегментированный (версия 0.3-0.0) в R и подогнал сегментированный glm следующим образом. (Последняя версия сегментированного пакета (т.е. 0.3–1.0), похоже, не поддерживает термин смещения при использовании функции прогнозирования.)
> library(segmented)
> fit.2=segmented(fit.1,seg.Z=~age,psi=list(age=mean(age)),
+ offs=off.set.term,data=newdat)
Затем я использовал функцию прогнозирования с fit.2
, чтобы получить прогнозируемые значения:
> library(segmented)
> fit.2=segmented(fit.1,seg.Z=~age,psi=list(age=mean(age)),offs=off.set.term,data=newdat)
>
> predict(fit.2,newdata =newdat,type="link")
1 2 3 4 5
-26.62968 -26.08611 -25.95997 -20.76125 -23.32456
Эти предсказанные значения значительно отличаются от того, которое я получил с помощью fit.1
.
Проблема, по-видимому, заключается в члене смещения, потому что, когда мы подбираем модели без члена смещения, тогда результаты разумны и близки друг к другу, как показано ниже:
> fit.3=glm(Y~age,data=dat,family=poisson)
> newdat.2=data.frame(age=c(52.09374,50.89329,50.61472,39.13358,44.79453))
> predict(fit.3,newdata =newdat.2,type="link")
1 2 3 4 5
2.406016 2.395531 2.393098 2.292816 2.342261
> fit.4=segmented(fit.3,seg.Z=~age,psi=list(age=mean(age)),data=newdat.2)
> predict(fit.4,newdata =newdat.2,type="link")
1 2 3 4 5
2.577669 2.524503 2.512165 2.003679 2.254396