Я социолог, в настоящее время использую простую модель модерации в R в форме y ~ x + m + m * x
. Мой модератор - это бинарная категориальная переменная (две отдельные группы).
Я начал с lm (), загрузил оценки с помощью boot () и получил доверительные интервалы bca с помощью boot.ci. Поскольку не существует автоматического способа сделать это для всех параметров (по крайней мере, на моем уровне кодирования), это немного утомительно. Однако теперь я увидел, что пакет lavaan
предлагает начальную загрузку как часть обычной функции sem()
, а также CI bca как часть parameterEstimates()
. Итак, мне было интересно (поскольку я использую лаву в других анализах), могу ли я просто заменить lm () на лаву, чтобы моя работа была более согласованной.
Делая это, я задавался вопросом, какой будет эквивалентная модель для лавы, чтобы таким же образом протестировать на модерацию. Я видел этот пост, где Джереми Майлз предлагает приведенный ниже код, который я следуют в основном.
mod.1 <- "
y ~ c(a, b) * x
y ~~ c(v1, v1) * y # This step needed for exact equivalence
y ~ c(int1, int2) * 1
modEff := a - b
mEff := int1 - int2"
Но было бы здорово, если бы вы помогли мне разобраться в некоторых последних вещах.
1) Что означает часть y ~~ c(v1, v1) * y
и зачем она нужна для «точной эквивалентности» модели lm? Судя по выходным данным, дисперсия результата для обеих групп сводится к одному и тому же значению?
2) Правильно ли я понимаю из сообщения, что включение эффекта взаимодействия, рассчитанного выше, ИЛИ ограничение (только) наклона между моделями и рассмотрение модели, подходящей для anova()
, будет таким же тестом на модерацию?
3) На странице лавы говорится, что добавление test = "bootstrap"
к функции sem()
позволяет настраивать ускорение p -ценности. Тем не менее, я много читал о p-значениях, иногда конфликтующих с bca-CI, и это случилось со мной. Осмотревшись, я понимаю, что этот конфликт исходит из предположений о распределении данных под H0 для p-значений, но не для CI (которые просто дают диапазон наиболее вероятных значений). Поэтому мне было интересно, что именно означает, что приведенные здесь p-значения "скорректированы с учетом начальной загрузки"? Является ли технически более верным сообщать об этом для моих моделей SEM, чем для CI?
Много вопросов, но я был бы очень благодарен за любую помощь, которую вы можете оказать.
Лучший,
Алекс