Тест на нормальность в R дает странный результат?

Возможный дубликат:
Просмотр данных нормально распределяется в R

У меня есть 6 наборов остатков (подгонка - модель), которые я проверяю на нормальность (я пытаюсь продемонстрировать, что отклонение от модели находится в пределах инструментального шума).

Графики ядерной плотности всех из них выглядят приблизительно гауссовыми, а графики qqnorm выглядят хорошо. Я прогнал все их через два теста на нормальность: shapiro.test {base} и ad.test {nortest}. Эти тесты показывают, что все наборы данных являются нормальными (p>>0,05, принимается нулевая гипотеза о нормальности), кроме одного. Обычно я бы не ставил под сомнение эти результаты, но тест, который возвращается как «ненормальный» (p‹0,05, отвергнуть нулевую гипотезу о нормальности), основан на наборе данных, который выглядит НАИБОЛЕЕ гауссовым... Я сбит с толку, и я бы оцените любую помощь!

Вот представлена матрица моих графиков остаточной плотности ядра с p-значениями из тестов нормальности Андерсона-Дарлинга (ad.test). Все графики имеют одинаковый масштаб (x и y). Ненормальной особенностью является график CvsD, отмеченный красным.

Вот ссылка на данные для сравнения CvsD.

Почему эти остатки не являются нормальными!?

r testing statistics normal-distribution

oscarbranson 09.11.2012 источник

comment

Я не думаю, что это дубликат, поскольку он спрашивает о конкретной проблеме, возникающей в результате этих тестов. Что касается нормальности — извините за философию, но как бы хороши ни были тесты на нормальность, компьютеры все еще далеки от возможностей пространственного анализа человеческого мозга. Используйте cuts и plot(CD_resids), чтобы увидеть, где могут существовать перекосы, и сравните это с rnorm, случайно генерирующим размер выборки 328 несколько раз. - Señor O 09.11.2012

comment

Возможно ли, что n сравнения CvsD намного выше, чем для других наборов? Если это так, то более низкое значение p может быть просто артефактом этого, ср. Комментарий @DWin. - Stephan Kolassa 09.11.2012

comment

Для теста на нормальность вы должны использовать тест Шапиро Уилка 'shapiro.test(x)' в R. - Ole Petersen 24.11.2015

Ответы (1)

arrow_upward
1
arrow_downward

На самом деле, мне это не кажется очень гауссовым; больше похоже на распределение t с большим n — оно гораздо более «остроконечное», чем нормальная кривая. И ad.test, и тест Шапиро возвращают p ‹ 0,05 (shapiro.test по вашим данным возвращает p = 0,002655).

Однако обратите внимание, что полезность тестов на нормальность оспаривается; см., например, этот вопрос. В основном, для больших размеров выборки даже небольшие отклонения от нормального распределения наказываются, и H0 отбрасывается.

Тем не менее, я все еще считаю, учитывая, что у вас всего 328 выборок, что в вашем случае распределение не совсем нормальное.

January 09.11.2012

comment

Распределение t с большим n практически неотличимо от нормального распределения, особенно на вид. И будет ли он более или менее остроконечным, зависит только от дисперсии нормального распределения. - Fojtasek; 09.11.2012

Тест на нормальность в R дает странный результат?

Ответы (1)

Похожие вопросы