plm и lm — разные результаты?

Я несколько раз пытался использовать lm и plm для регрессии. И получаю разные результаты.

Сначала я использовал lm следующим образом:

fixed.Region1 <- lm(CapNormChange ~ Policychanges + factor(Region), 
    data=Panel)

Далее я использовал plm следующим образом:

fixed.Region2 <- plm(CapNormChange ~ Policychanges+ factor(Region), 
    data=Panel, index=c("Region", "Year"), model="within", effect="individual")

Я думаю, что с plm что-то не так, потому что я не вижу перехвата в результатах (см. ниже). Кроме того, я не совсем уверен, нужен ли + factor (Region), однако, если его нет, я не вижу коэффициентов (и значимости) для пустышки.

Итак, мой вопрос:

  1. Я неправильно использую функцию plm? (или что в нем не так)
  2. Если нет, то как может быть, что результаты отличаются?

Если кто-то может дать мне подсказку, я был бы очень признателен.

Результаты от ЛМ:

Call:
lm(formula = CapNormChange ~ Policychanges + factor(Region), 
    data = Panel)

Residuals:
    Min      1Q  Median      3Q     Max 
-31.141  -4.856  -0.642   1.262 192.803 

Coefficients:
                                Estimate Std. Error t value Pr(>|t|)    
(Intercept)                      17.3488     4.9134   3.531 0.000558 ***
Policychanges                     0.6412     0.1215   5.277 4.77e-07 ***
factor(Region)Asia              -19.3377     6.7804  -2.852 0.004989 ** 
factor(Region)C America + Carib   0.1147     6.8049   0.017 0.986578    
factor(Region)Eurasia           -17.6476     6.8294  -2.584 0.010767 *  
factor(Region)Europe            -20.7759     8.8993  -2.335 0.020959 *  
factor(Region)Middle East       -17.3348     6.8285  -2.539 0.012200 *  
factor(Region)N America         -17.5932     6.8064  -2.585 0.010745 *  
factor(Region)Oceania           -14.0440     6.8417  -2.053 0.041925 *  
factor(Region)S America         -14.3580     6.7781  -2.118 0.035878 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 19.72 on 143 degrees of freedom
Multiple R-squared:  0.3455,    Adjusted R-squared:  0.3043 
F-statistic: 8.386 on 9 and 143 DF,  p-value: 5.444e-10`

Результаты PLM:

 Call:
plm(formula = CapNormChange ~ Policychanges, data = Panel, effect = "individual", 
    model = "within", index = c("Region", "Year"))

Balanced Panel: n = 9, T = 17, N = 153

Residuals:
     Min.   1st Qu.    Median   3rd Qu.      Max. 
-31.14147  -4.85551  -0.64177   1.26236 192.80277 

Coefficients:
              Estimate Std. Error t-value  Pr(>|t|)    
Policychanges  0.64118    0.12150   5.277 4.769e-07 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Total Sum of Squares:    66459
Residual Sum of Squares: 55627
R-Squared:      0.16299
Adj. R-Squared: 0.11031
F-statistic: 27.8465 on 1 and 143 DF, p-value: 4.7687e-07`

r plm
person Sarah8888    schedule 01.03.2018    source источник
comment
Я на самом деле не вижу вопроса в вашем вопросе   -  person Dason    schedule 01.03.2018
comment
Я попытался сделать это более ясным сейчас. Спасибо.   -  person Sarah8888    schedule 01.03.2018
comment
Я не понимаю вашего вопроса. Почему вы ожидаете, что линейная регрессия (также известная как объединенная МНК) даст те же результаты, что и регрессия панели с фиксированными эффектами? Вы строго говорите о перехвате и отсутствии разницы в перехвате? Если это так, то отдельная модель с фиксированными эффектами не имеет одного перехвата, а имеет несколько, поэтому не сообщается как таковая.   -  person acylam    schedule 01.03.2018
comment
Я предположил, что, поскольку фиксированные эффекты (индивидуальные) аналогичны введению фиктивных переменных (насколько я понимаю), результаты должны включать либо n-1 фиктивные переменные + сообщаемый перехват, либо все фиктивные переменные. В этом случае PLM-функция (второй случай) сообщает n-1 фиктивных переменных, но не перехватывает. Следовательно, это то, что я не понимаю. Или может быть я чего-то еще не понимаю.   -  person Sarah8888    schedule 02.03.2018
comment
Что касается другого вопроса: LM-регрессия включает в себя фиктивные переменные (регионы) и, следовательно, в моем понимании соответствует моделям с фиксированными эффектами (которые используют регионы в качестве эффектов). Следовательно, именно по этой причине я не понимаю результатов.   -  person Sarah8888    schedule 02.03.2018
comment
@Dason ... ты слишком много знаешь о бесполезных пакетах R. ;p Q перейти к Выглядит нормально, окончание проверки сортировки.   -  person ZF007    schedule 02.03.2018
comment
Не уверен, что вы имеете в виду под этим.   -  person Sarah8888    schedule 02.03.2018
comment
хорошо, я нашел проблему, если это представляет интерес. У меня в основном была ошибка в формулировке индекса. я использую   -  person Sarah8888    schedule 02.03.2018
comment
@ ZF007 ZF007 Я не комментировал в очереди на проверку, и вопрос был отредактирован с тех пор, как я написал свой комментарий. Я не совсем уверен, что вы пытаетесь сказать в любом случае, но я предполагаю, что это не имеет значения, учитывая то, что я только что упомянул.   -  person Dason    schedule 02.03.2018
comment
@ Sarah8888 .. вы можете опубликовать ответ, в котором вы указываете свой фрагмент кода, который вы изменили. Снова не весь код ;p Через два дня вы можете выбрать свой ответ как лучший ответ.   -  person ZF007    schedule 02.03.2018
comment
Извините за это... было бы лучше. Соглашаться.   -  person Sarah8888    schedule 02.03.2018


Ответы (1)


Вам нужно будет пропустить + factor(Region) в вашей формуле для внутренней модели с plm, чтобы получить то, что вы хотите.

Внутри моделей нет перехвата, но некоторые программные пакеты (особенно Stata и Gretl) сообщают об этом. Вы можете оценить это с помощью plm, запустив within_intercept на предполагаемой модели. На странице справки есть подробности об этом несколько искусственном перехвате.

Если вам нужны отдельные эффекты и их значение, используйте summary(fixef(<your_plm_model>)). Используйте pFtest, чтобы проверить, соответствует ли спецификация требованиям.

Квадраты R расходятся между моделью lm и моделью plm. Это связано с тем, что модель lm (если она используется таким образом с манекенами, ее обычно называют моделью LSDV (фиктивные переменные методом наименьших квадратов)) дает то, что иногда называют общим R в квадрате, в то время как plm дает вам R в квадрате униженного регрессия, иногда называемая в пределах R в квадрате. В документации Stata есть некоторые подробности об этом: https://www.stata.com/manuals/xtxtreg.pdf

person Helix123    schedule 01.03.2018
comment
Да и нет ! Я сделал это - см. мой обновленный вопрос. Однако R в квадрате и с поправкой все же разные! Ты знаешь почему? - person Sarah8888; 02.03.2018
comment
Кроме того, большое спасибо за резюме (fixef. код! очень полезно - person Sarah8888; 02.03.2018