Публикации по теме 'missing-data'
Все о пропущенных значениях и их типах
Отсутствующие данные могут возникать, когда информация не предоставляется по одному или нескольким элементам или по всей единице. Отсутствующие данные — очень большая проблема в реальных сценариях. Отсутствующие данные также могут называться значениями NA (недоступно) в pandas. В DataFrame иногда многие наборы данных просто поступают с отсутствующими данными либо потому, что они существуют и не собирались, либо никогда не существовали. Например, предположим, что разные опрошенные..
Объяснение замены отсутствующих данных
Замена отсутствующих данных делает модели машинного обучения менее понятными. Вот как…
Введение
Ввод пропущенных значений - важный шаг при работе с реальными данными. Есть несколько общих подходов к решению этой проблемы. Некоторые из популярных методов включают удаление экземпляра с отсутствующими значениями, создание отдельной категории для отсутствующих элементов или использование средних значений. Они не обязательно эффективны, и существуют другие алгоритмы, такие как KNN,..
Вопросы по теме 'missing-data'
R отставание от отсутствующих данных
Есть ли вариант лага, который удерживает НА в позиции? Я хочу вычислить возврат данных о ценах, где данные могут отсутствовать.
Столбец 1 - ценовые данные. Столбец 2 - отставание цены. Столбец 3 показывает p - лаг (p) - доходность от 99 до 104...
1860 просмотров
schedule
21.03.2022
Постройте множественные результаты вменения
Я успешно выполнил множественное вменение недостающих данных моего исследования анкеты с использованием пакета MICE в R и выполнил линейную регрессию для объединенных вмененных переменных. Кажется, я не могу понять, как извлечь отдельные объединенные...
3641 просмотров
schedule
27.06.2023
Где мои выходные данные редуктора AWS EMR для моей выполненной работы (должны быть на S3, но там ничего)?
У меня проблема, из-за которой моя работа Hadoop в AWS EMR не сохраняется в S3. Когда я запускаю задание на меньшем образце, оно отлично сохраняет результат. Когда я запускаю ту же команду, но с полным набором данных, задание снова завершается, но...
3378 просмотров
schedule
18.01.2023
Возвращайте FALSE для дублированных значений NA при использовании функции дублирования()
просто интересно, почему дублирование ведет себя так, как с NA:
> duplicated(c(NA,NA,NA,1,2,2))
[1] FALSE TRUE TRUE FALSE FALSE TRUE
где на самом деле
> NA == NA
[1] NA
есть ли способ добиться того, чтобы дублированные...
2415 просмотров
schedule
04.04.2024
запрос t-sql, который возвращает отсутствующие записи
У меня есть запрос (ContactFormTypesRequired), который возвращает ContactID и FormTypeID с использованием связанных таблиц, которые не показаны ниже. Это список типов форм, которые каждый контакт должен иметь отношение к себе как к форме.
Мне...
669 просмотров
schedule
20.05.2023
В чем разница между ‹NA› и NA?
У меня есть фактор с именем SMOKE с уровнями Y и N. Отсутствующие значения были заменены на NA (с начального уровня NULL). Однако, когда я просматриваю фактор, я получаю что-то вроде этого:
head(SMOKE)
# N N <NA> Y Y N
# Levels: Y N...
21811 просмотров
schedule
18.05.2023
Отставание с отсутствующими данными
У меня есть набор данных о рейтингах одобрения на уровне штата. Мне нужно отставать от одной из переменных на два года.
Данные являются годовыми и охватывают период с 1970 по 2008 год. Очевидно, что если я запаздываю с данными, я потеряю некоторые...
416 просмотров
schedule
15.07.2023
Не удается получить все результаты из SQL-запроса
Я пытаюсь создать запрос, используя файлы cookie (избранные элементы)
<?php
$favnum=0;
$FavList = 'WHERE ';
foreach ($_COOKIE as $name => $value) {
if ($value == '1'){
if($name != 'PHPSESSID'){...
313 просмотров
schedule
07.09.2022
Ошибка в 1:ncol(x): аргумент длины 0 при использовании Amelia в R
Я работаю с панельными данными. У меня есть более 6000 наблюдений за годом страны, и я уточнил мое вменение Амелии следующим образом:
(CountDependentVariable, m=5, ts="year", cs="cowcode",
sqrts=c("OtherCountVariable2",...
17802 просмотров
schedule
07.03.2022
R Отсутствующие значения
Я новичок в R и пытаюсь провести факторный анализ (метод = pca. Вращение = varimax и количество факторов равно 6). У меня есть данные опроса, которые я загрузил в R, а затем выбрал подмножество наблюдений и переменных. Я сделал следующее:...
2293 просмотров
schedule
24.05.2024
Как заставить Python изящно форматировать None и несуществующие поля [дубликаты]
Если я пишу на Python:
data = {'n': 3, 'k': 3.141594, 'p': {'a': 7, 'b': 8}}
print('{n}, {k:.2f}, {p[a]}, {p[b]}'.format(**data))
del data['k']
data['p']['b'] = None
print('{n}, {k:.2f}, {p[a]}, {p[b]}'.format(**data))
Я получил:
3, 3.14,...
31483 просмотров
schedule
20.01.2024
Для NVD3 lineChart Удалить отсутствующие значения (чтобы иметь возможность интерполировать)
Я использую NVD3 для визуализации данных об экономическом неравенстве. Диаграмма для США находится здесь: http://www.chartbookofeconomicinequality.com/inequality-by-country/USA/
Это две диаграммы lineCharts, расположенные друг над другом....
3305 просмотров
schedule
20.01.2023
Гистограмма факторной переменной, включая пропущенные значения как уровень
У меня есть кадр данных с факториальной переменной, которая включает пропущенные значения. Я хотел бы построить гистограмму, включающую значения «a», «b», а также «NA» в качестве другого уровня.
df1 <- data.frame(id = 1:6, fact1 =...
1585 просмотров
schedule
22.05.2023
XSLT: цикл for-each с ключом, не возвращающим все узлы
Я начинающий XSLT-разработчик. Меня попросили исправить проблему в проекте, в котором исходного разработчика больше нет с нами. В XSLT есть цикл for-each , использующий key и count .
<xsl:for-each select="ns0:BOM[count(. | key('subsat',...
460 просмотров
schedule
12.11.2023
Заменить отсутствующие значения средним по столбцу
Я не уверен, как перебирать каждый столбец, чтобы заменить значения NA на среднее значение столбца. Когда я пытаюсь заменить один столбец следующим, он работает хорошо.
Column1[is.na(Column1)] <- round(mean(Column1, na.rm = TRUE))
Код для...
158506 просмотров
schedule
23.02.2022
NA в функциях кластеризации (kmeans, pam, clara). Как связать кластеры с исходными данными?
Мне нужно сгруппировать некоторые данные, и я пробовал kmeans , pam и clara с R.
Проблема в том, что мои данные находятся в столбце фрейма данных и содержат NA.
Я использовал na.omit() для получения своих кластеров. Но тогда как я могу...
14529 просмотров
schedule
25.12.2023
Вычислить значения для отсутствующих строк
У меня есть SQL-запрос, который извлекает прогнозы в день. Если для данного «LP» отсутствует прогноз, я хотел бы рассчитать его на основе других прогнозов. Однако с приведенным ниже кодом он не рассчитывает прогнозы, когда они отсутствуют....
54 просмотров
schedule
25.03.2024
Присвоить значение отсутствующим данным, которых еще нет в массиве
У меня есть простой массив a , содержащий девять значений от 1 до 10 . Отсутствующей точке данных в этом массиве присваивается значение 0 .
Мне нужно заменить это значение в массиве значением 0<x>10 , но, что особенно важно, это не...
158 просмотров
schedule
28.03.2023
param отсутствует или значение пустое: статус
Когда я пытаюсь отправить новый статус, я получаю следующее. У меня есть регистрационная форма, которая работает нормально, не знаю, что здесь происходит. Цените помощь.
def status_params
params.require(:status).permit(:type_id, :user_id)
end...
582 просмотров
schedule
17.10.2022
Комплект для разработки Java SE не установлен правильно?
Прежде всего, позвольте мне сказать, что я сделал все это во время просмотра этого видео: https://www.youtube.com/watch?v=Hl-zzrqQoSE
Итак, я попробовал загрузить jdk-8u60 для 64-битной Windows, как показано здесь:...
783 просмотров
schedule
28.05.2022