Вопросы по теме 'imputation'

Постройте множественные результаты вменения
Я успешно выполнил множественное вменение недостающих данных моего исследования анкеты с использованием пакета MICE в R и выполнил линейную регрессию для объединенных вмененных переменных. Кажется, я не могу понять, как извлечь отдельные объединенные...
3641 просмотров
schedule 27.06.2023

R: объединение столбцов по общему идентификатору без NA в любой строке?
Учитывая данные с пропущенными значениями, вменение — это процесс, в котором пропущенные значения заменяются некоторыми значениями. Цель состоит в том, чтобы игнорировать строки с отсутствующими значениями, обозначенными NA. Такую строку можно...
1319 просмотров
schedule 14.02.2022

Заменить отсутствующие значения средним по столбцу
Я не уверен, как перебирать каждый столбец, чтобы заменить значения NA на среднее значение столбца. Когда я пытаюсь заменить один столбец следующим, он работает хорошо. Column1[is.na(Column1)] <- round(mean(Column1, na.rm = TRUE)) Код для...
158506 просмотров
schedule 23.02.2022

Проверка отсутствующих значений в R
У меня есть набор данных временных рядов, в котором есть некоторые недостающие значения. Я хочу вменять недостающие значения, но я не уверен, какой метод является наиболее подходящим, например, линейный, сплайновый или stine из пакета imputeTS ....
2945 просмотров
schedule 08.03.2022

Линейная интерполяция NaN в кадре данных pandas на основе двух его соседей (сверху и снизу или слева и справа)
У меня есть фрейм данных с одним столбцом значений с плавающей запятой и отметкой времени в качестве индекса, аналогичного приведенному ниже. Все метки времени в индексе сортируются в порядке возрастания. timestamp value 2014-01-08...
740 просмотров

множественное вменение и многогрупповой SEM в R
Я хочу выполнить многогрупповой SEM для вмененных данных, используя пакеты R mice и semTools , в частности функцию runMI , которая вызывает Lavaan . Я могу сделать это при одновременном вменении всего набора данных, но, просматривая...
403 просмотров
schedule 01.12.2022

Как использовать множественные вмененные данные для дальнейшего анализа в SVM и ANN?
Мои исходные данные содержат некоторые недостающие значения, и я использовал несколько вменений для их заполнения. Моя следующая цель - использовать эти данные в SVM и ANN. Первоначально я думал, что MI даст мне «объединенный» завершенный набор...
136 просмотров
schedule 09.08.2022

Ошибка IterativeImputer: ввод содержит NaN, бесконечность или слишком большое значение для dtype('float64')
Я работаю над набором данных с несколькими отсутствующими значениями в его атрибутах. Выполнив типичную процедуру предварительной обработки данных, мой следующий шаг — попытаться подогнать регрессионную модель для вменения пропущенных значений....
696 просмотров
schedule 09.02.2024

Язык R Amelia указать префикс выходных файлов
Этот оператор R использует пакет Amelia для создания файлов выходных данных, содержащих вмененные данные: ds.im <- amelia(ds, m=5, p2s=2) Имена 5 выходных файлов: от output1.csv до output5.csv. В пакете Amelia есть способ указать префикс...
24 просмотров
schedule 18.10.2023

Как вменить средства в конкретные наблюдения в столбце?
На данный момент у меня есть задание, включающее таблицу данных, которая включает информацию о наблюдениях за видами животных, измеряемых в разных случаях. В столбце «вес» моих данных есть пропущенные значения, которые я должен заменить средним весом...
35 просмотров
schedule 31.03.2023

Hot Deck Imputation в Python
Я пытался найти код Python, который позволил бы мне заменить отсутствующие значения в столбце фрейма данных. Основное внимание в моем анализе уделяется биостатистике, поэтому мне неудобно заменять значения с помощью средних / медиан / режимов. Я...
2890 просмотров
schedule 19.04.2022

Устранение неполадок вменения MICE в R с категориальными переменными
Я пытался экспериментировать с MICE на данных из Kaggle, но у меня возникли проблемы с вменением категориальной переменной. Я работал над этой записной книжкой - https://www.kaggle.com/rtatman/animal-bites и пытался предсказать вид (SpeciesIDDesc)....
140 просмотров
schedule 27.03.2023

Заполните пропущенные значения с помощью линейной регрессии
У меня есть фрейм данных, который содержит 7 столбцов. str(df) 'data.frame': 8760 obs. of 7 variables: $ G1_d20_2014.SE1_ : num 25.1 25.1 25 25 25.1 ... $ G1_d20_2014.SE4_ : num 42.4 42.3 42.3 42.3 42.3 ... $ G1_d20_2014.SE7_ : num 34.4...
636 просмотров
schedule 02.11.2022

Удалите нули в кадре данных pandas, не влияя на результат вменения
У меня timeseries dataset с 5M rows . В столбце есть 19.5% missing values , 80% zeroes (не ориентируйтесь на процентные значения - хотя это означает, что полезны только 0,5% данных, но тогда достаточно 0,5% от 5M). Теперь мне нужно вменять...
247 просмотров
schedule 30.05.2023

Какой метод вменения использовать для заполнения отсутствующих данных о населении на основе 3 категориальных столбцов?
Я новичок в науке о данных. Извините, если вопрос неясен. **My Data is following format:** *year age_group pop Gender Ethnicity 0 1957 0 - 4 Years 264727 Mixed Mixed 1 1957 5 - 9 Years 218097 Male...
133 просмотров
schedule 14.02.2023

Использование вмененных наборов данных из библиотеки mouses() для соответствия многоуровневой модели в R
Я новичок в пакетировании mice в R. Но я пытаюсь вычислить 5 наборов данных из popmis , а затем подобрать lmer() модель with() для каждого и, наконец, pool() для них. Я думаю, что функция pool() в mice() не работает с вызовом lmer()...
322 просмотров
schedule 16.01.2024