Я пытаюсь запустить тест Колмогорова-Смирнова, используя функцию ks_2samp из scipy, чтобы определить, относятся ли гистограммы данных к одному и тому же распределению. Однако возвращаемое значение p иногда кажется не совсем правильным...
Например, с помощью этой гистограммы:
aa, bb, cc = ax1.hist(list1, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid', rwidth=1, linestyle = 'dashed', linewidth = 1.5)
dd, ee, ff = ax1.hist(list2, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid',rwidth=1)
print ks_2samp(aa, dd)`[1]`
Я получаю возвращаемое значение p около 0,96, что действительно кажется неправильным... я делаю что-то не так? Разве эти гистограммы не должны быть достаточно разными, чтобы p-значение было ниже?
ks_2samp(list1, list2)
- person cel   schedule 15.07.2016