Почему доверительный интервал не соответствует стандартным ошибкам в этой регрессии?

Я запускаю линейную регрессию с фиксированным эффектом и стандартными ошибками, сгруппированными по определенной группе.

 areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id)

Однострочный код такой же, как указано выше, и вывод выглядит следующим образом: введите здесь описание изображения

Теперь t-статистика и значения P выглядят несовместимыми. Как мы можем иметь t-stat > 5 и pval > 11%? Точно так же 95% доверительные интервалы кажутся намного шире, чем Coeff. +- 2 станд. Ошиб.

Что мне не хватает?


person impossibru    schedule 25.05.2020    source источник


Ответы (1)


Здесь нет ничего противоречивого. У вас небольшой размер выборки и менее экономная модель, и почти все степени свободы исчерпаны. Обратите внимание, что areg не публикует статистику F или значение P для модели, что является сильным признаком опасности. Ваша статистика t согласуется с проверками вручную:

. display 2 * ttail(1, 5.54)
.11368912

. display 2 * ttail(1, 113.1)
.00562868

Короче говоря, здесь нет ошибки и нет проблемы с программированием. Это просто вопрос вашей модели, которая переопределяет ваши данные и побочные эффекты этого.

Точно так же +/- 2 SE для доверительного интервала 95% здесь далеко не соответствует эмпирическому правилу. Опять же, ручной расчет поучителен:

. display invt(1, 0.975)
12.706205

. display invt(60, 0.975)
2.0002978

. display invt(61, 0.975)
1.9996236

. display invnormal(0.975)
1.959964
person Nick Cox    schedule 25.05.2020
comment
Большое спасибо. Так есть ли смысл вообще создавать кластеризованную стандартную ошибку, когда есть только две группы? Группы - это страны. В первой стране ~ 50 наблюдений, а в стране 2 ~ 30 наблюдений. - person impossibru; 25.05.2020
comment
Вопрос в том, сколько параметров вы оцениваете. не использование кластеризованных SE. - person Nick Cox; 26.05.2020