Я хотел бы знать, можно ли суммировать распределения Пуассона и нулевого раздувания Пуассона. Если я не ошибаюсь, возможна сумма распределений Пуассона, и вы все равно получите распределение Пуассона.
Однако, если мы суммируем распределение с нулевым завышением, результирующее больше не будет распределением Пуассона, например:
a <- data.frame(x = seq(1:100), y=rpois(1:100,2))
glma <- glm(y~x, data = a, family = "poisson")
dp <- sum(residuals(glma,type ="pearson")^2)/glma$df.residual
dp_total <- c()
for (j in 1:1000) {
b <- data.frame(x = seq(1:100), y=rpois(1:100,runif(1, 1, 50)))
c<- a$y + b$y
c <- data.frame(x = seq(1:100), y=c)
glmc <- glm(y~x, data = c, family = "poisson")
dp <- sum(residuals(glmc,type ="pearson")^2)/glmc$df.residual
dp_total <- c(dp_total,dp)
a$y <- c$y
}
Если дисперсия около 1, это соответствует распределению Пуассона:
> max(dp_total)
[1] 1.493674
> mean(dp_total)
[1] 1.21753
> min(dp_total)
[1] 0.7643539
Однако, если мы суммируем набор данных с нулевым завышением, значение дисперсии начинает увеличиваться.
for (j in 1:1000) {
b <- data.frame(x = seq(1:100), y=rpois(1:100, runif(1, 0, 1)))
c <- a$y + b$y
c <- data.frame(x = seq(1:100), y=c)
glmc <- glm(y~x, data = c, family = "poisson")
dp <- sum(residuals(glmc,type ="pearson")^2)/glmc$df.residual
dp_total <- c(dp_total,dp)
a$y <- c$y
}
Значение дисперсии начинает увеличиваться при суммировании данных Пуассона с нулевым завышением.
Как я могу смоделировать данные, сформированные с помощью Пуассона и нулевого завышения Пуассона?