Тест на нормальность в R дает странный результат?

Возможный дубликат:
Просмотр данных нормально распределяется в R

У меня есть 6 наборов остатков (подгонка - модель), которые я проверяю на нормальность (я пытаюсь продемонстрировать, что отклонение от модели находится в пределах инструментального шума).

Графики ядерной плотности всех из них выглядят приблизительно гауссовыми, а графики qqnorm выглядят хорошо. Я прогнал все их через два теста на нормальность: shapiro.test {base} и ad.test {nortest}. Эти тесты показывают, что все наборы данных являются нормальными (p>>0,05, принимается нулевая гипотеза о нормальности), кроме одного. Обычно я бы не ставил под сомнение эти результаты, но тест, который возвращается как «ненормальный» (p‹0,05, отвергнуть нулевую гипотезу о нормальности), основан на наборе данных, который выглядит НАИБОЛЕЕ гауссовым... Я сбит с толку, и я бы оцените любую помощь!

Вот представлена ​​матрица моих графиков остаточной плотности ядра с p-значениями из тестов нормальности Андерсона-Дарлинга (ad.test). Все графики имеют одинаковый масштаб (x и y). Ненормальной особенностью является график CvsD, отмеченный красным.

Вот ссылка на данные для сравнения CvsD.

Почему эти остатки не являются нормальными!?


person oscarbranson    schedule 09.11.2012    source источник
comment
Я не думаю, что это дубликат, поскольку он спрашивает о конкретной проблеме, возникающей в результате этих тестов. Что касается нормальности — извините за философию, но как бы хороши ни были тесты на нормальность, компьютеры все еще далеки от возможностей пространственного анализа человеческого мозга. Используйте cuts и plot(CD_resids), чтобы увидеть, где могут существовать перекосы, и сравните это с rnorm, случайно генерирующим размер выборки 328 несколько раз.   -  person Señor O    schedule 09.11.2012
comment
Возможно ли, что n сравнения CvsD намного выше, чем для других наборов? Если это так, то более низкое значение p может быть просто артефактом этого, ср. Комментарий @DWin.   -  person Stephan Kolassa    schedule 09.11.2012
comment
Для теста на нормальность вы должны использовать тест Шапиро Уилка 'shapiro.test(x)' в R.   -  person Ole Petersen    schedule 24.11.2015


Ответы (1)


На самом деле, мне это не кажется очень гауссовым; больше похоже на распределение t с большим n — оно гораздо более «остроконечное», чем нормальная кривая. И ad.test, и тест Шапиро возвращают p ‹ 0,05 (shapiro.test по вашим данным возвращает p = 0,002655).

Однако обратите внимание, что полезность тестов на нормальность оспаривается; см., например, этот вопрос. В основном, для больших размеров выборки даже небольшие отклонения от нормального распределения наказываются, и H0 отбрасывается.

Тем не менее, я все еще считаю, учитывая, что у вас всего 328 выборок, что в вашем случае распределение не совсем нормальное.

person January    schedule 09.11.2012
comment
Распределение t с большим n практически неотличимо от нормального распределения, особенно на вид. И будет ли он более или менее остроконечным, зависит только от дисперсии нормального распределения. - person Fojtasek; 09.11.2012