Как использовать множественные вмененные данные для дальнейшего анализа в SVM и ANN?

Мои исходные данные содержат некоторые недостающие значения, и я использовал несколько вменений для их заполнения. Моя следующая цель - использовать эти данные в SVM и ANN. Первоначально я думал, что MI даст мне «объединенный» завершенный набор данных, но оказалось, что MI дает только объединенные результаты анализа в отношении вмененных наборов данных. Итак, мои вопросы: 1) Есть ли способ, как и любое уравнение, я могу использовать для агрегирования вмененных наборов данных в один набор данных и использования его для дальнейшего анализа; 2) Если нет, то как продолжить мое исследование с использованием нескольких наборов данных. Спасибо!


person Jake9226    schedule 18.07.2018    source источник


Ответы (1)


Это общее заблуждение о МИ.

Общий процесс должен быть таким:

  1. Множественное вменение
  2. Анализ для каждого вмененного набора данных
  3. Объединение

Если вы выполните вменение, а затем объедините весь вмененный набор данных в один вмененный набор данных, вы потеряете все преимущества МИ. Тогда вы могли бы просто использовать любой другой метод вменения. Идея состоит в том, чтобы выполнить анализ, например, 5 раз, по одному разу для каждого вмененного набора данных. Потому что вы хотите учесть различные результаты, которые мог бы иметь ваш анализ с разными вмененными наборами входных данных. После этого вы объединяете результаты своего анализа. В машинном обучении этот процесс встречается не так часто. Но в вашем случае вы можете, например, использовать SVM для всех 5 наборов данных, а затем затем сравнить результаты / придумать процедуру для объединения / объединения результатов.

person Steffen Moritz    schedule 23.07.2018