У меня есть несколько вопросов относительно полезности числа наборов данных с множественным условным исчислением "m". Я понял, что мыши будут повторять процесс вменения недостающих значений в наборе данных m раз.
1) Учитывают ли мыши вменение предыдущего шага и, таким образом, каждый шаг приближается к возможной конвергенции, или каждый шаг полностью независим друг от друга?
2) Если каждый шаг не зависит друг от друга, какой смысл иметь несколько наборов вмененных данных для целей вменения?
В статье, объясняющей мышей, есть схема, показывающая несколько шагов вменения
Я полагаю, что чем больше у нас вмененного набора данных, тем лучше, когда мы хотим объединить результаты, однако этап анализа результатов подразумевает создание прогнозной модели, которая может быть:
#build predictive model
fit <- with(data = imp, lm(y ~ x + z))
Что произойдет, если в моем наборе данных нет столбца или меток для прогнозирования? Действительно, мой набор данных содержит измерения геномики, и все они независимы. Как я могу объединить результаты или объединить m условно исчисленных наборов данных, не выполняя шаг прогнозирования?
Лучший,
Бабас
pool()
не поддерживает ваш анализ, вы можете объединить свои результаты вручную, используя правила Рубина после выполнения анализа для каждого вмененного набора данных. - person Wietze314   schedule 15.05.2018