Интерпретация сводной статистики с категориальными переменными

С этим выводом я знаю, что перехват происходит, когда оба фактора равны 0. Я понимаю, что фактор (V1) 1 означает V1 = 1, а фактор (V2) 1 означает V2 = 1. Чтобы получить наклон только для V1 = 1, я бы добавил 5,1122 + (-0,4044). Однако мне интересно, как интерпретировать p-значения в этом выводе. Если просто V1 = 1, значит ли это, что p-значение равно 2,39e-12 + 0,376? Если это так, каждая модель, которую я запускаю, имеет значение только тогда, когда все факторы = 0...

> lm.comfortgender=lm(V13~factor(V1)+factor(V2),data=comfort.txt)
> summary(lm.comfortgender)

Call:
lm(formula = V13 ~ factor(V1) + factor(V2), data = comfort.txt)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.5676 -1.0411  0.1701  1.4324  2.0590 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   5.1122     0.5244   9.748 2.39e-12 ***
factor(V1)1  -0.4044     0.4516  -0.895    0.376    
factor(V2)1   0.2332     0.5105   0.457    0.650    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.487 on 42 degrees of freedom
Multiple R-squared:  0.02793,   Adjusted R-squared:  -0.01836 
F-statistic: 0.6033 on 2 and 42 DF,  p-value: 0.5517

person Lindsey Register    schedule 13.11.2015    source источник
comment
Это скорее вопрос с перекрестной проверкой, и вам, вероятно, следует обратиться к учебнику по статистике здесь. Значение p, на которое вы ссылаетесь, - это значение перехвата. Это не имеет ничего общего со значением модели - на самом деле для этого нет никакой меры, если только вы не хотите учитывать R-квадрат (для которого ваш показатель чрезвычайно низок). Это также тот случай, когда ваш F-стат низкий, что означает, что ваша модель плохо определена (или высока вероятность того, что ваши коэффициенты будут равны нулю).   -  person Jason    schedule 13.11.2015


Ответы (1)


Значения p, полученные в качестве выходных данных в R регрессионных моделях, проверяют нулевую гипотезу о том, что среднее значение распределения этого конкретного коэффициента равно нулю, при условии, что распределение является нормальным, а стандартное отклонение представляет собой квадратный корень из дисперсии. Дополнительные разъяснения см. в этом другом ответе.

person gented    schedule 13.11.2015