Я хотел бы выполнить следующий тест в R, используя тест Колмогорова-Смирнова:
1) Появление различных целых чисел в первых 4000 знаков после запятой числа пи следующее:
0 1 2 3 4 5 6 7 8 9
368 426 408 374 405 415 398 376 400 430
Проверьте нулевую гипотезу о том, что появление различных целых чисел подчиняется равномерному распределению, как если бы пи было случайным числом.
Пытаться:
Я получил кумулятивную функцию плотности вероятности и установил ее как x.
x <- c(.092,.1985,.3005,.394,.49525,.599,.6985,.7925,.8925,1)
ks.test(x,y="punif")
Это выводит:
One-sample Kolmogorov-Smirnov test
data: x
D = 0.1005, p-value = 0.9996
alternative hypothesis: two-sided
Однако выполнение этого вручную дает D=0,008. Что я сделал не так?
Ручной расчет:
Предполагая единообразие, у нас будет следующий cdf:
.1, .2, .3, .4, .5, .6, .7, .8, .9, 1
Затем я нашел абсолютное значение разницы между этими значениями и x, как я определил выше, чтобы получить максимальную разницу 0,008.