Публикации по теме 'missing-data'


Все о пропущенных значениях и их типах
Отсутствующие данные могут возникать, когда информация не предоставляется по одному или нескольким элементам или по всей единице. Отсутствующие данные — очень большая проблема в реальных сценариях. Отсутствующие данные также могут называться значениями NA (недоступно) в pandas. В DataFrame иногда многие наборы данных просто поступают с отсутствующими данными либо потому, что они существуют и не собирались, либо никогда не существовали. Например, предположим, что разные опрошенные..

Объяснение замены отсутствующих данных
Замена отсутствующих данных делает модели машинного обучения менее понятными. Вот как… Введение Ввод пропущенных значений - важный шаг при работе с реальными данными. Есть несколько общих подходов к решению этой проблемы. Некоторые из популярных методов включают удаление экземпляра с отсутствующими значениями, создание отдельной категории для отсутствующих элементов или использование средних значений. Они не обязательно эффективны, и существуют другие алгоритмы, такие как KNN,..

Вопросы по теме 'missing-data'

R отставание от отсутствующих данных
Есть ли вариант лага, который удерживает НА в позиции? Я хочу вычислить возврат данных о ценах, где данные могут отсутствовать. Столбец 1 - ценовые данные. Столбец 2 - отставание цены. Столбец 3 показывает p - лаг (p) - доходность от 99 до 104...
1860 просмотров
schedule 21.03.2022

Постройте множественные результаты вменения
Я успешно выполнил множественное вменение недостающих данных моего исследования анкеты с использованием пакета MICE в R и выполнил линейную регрессию для объединенных вмененных переменных. Кажется, я не могу понять, как извлечь отдельные объединенные...
3641 просмотров
schedule 27.06.2023

Где мои выходные данные редуктора AWS EMR для моей выполненной работы (должны быть на S3, но там ничего)?
У меня проблема, из-за которой моя работа Hadoop в AWS EMR не сохраняется в S3. Когда я запускаю задание на меньшем образце, оно отлично сохраняет результат. Когда я запускаю ту же команду, но с полным набором данных, задание снова завершается, но...
3378 просмотров

Возвращайте FALSE для дублированных значений NA при использовании функции дублирования()
просто интересно, почему дублирование ведет себя так, как с NA: > duplicated(c(NA,NA,NA,1,2,2)) [1] FALSE TRUE TRUE FALSE FALSE TRUE где на самом деле > NA == NA [1] NA есть ли способ добиться того, чтобы дублированные...
2415 просмотров
schedule 04.04.2024

запрос t-sql, который возвращает отсутствующие записи
У меня есть запрос (ContactFormTypesRequired), который возвращает ContactID и FormTypeID с использованием связанных таблиц, которые не показаны ниже. Это список типов форм, которые каждый контакт должен иметь отношение к себе как к форме. Мне...
669 просмотров
schedule 20.05.2023

В чем разница между ‹NA› и NA?
У меня есть фактор с именем SMOKE с уровнями Y и N. Отсутствующие значения были заменены на NA (с начального уровня NULL). Однако, когда я просматриваю фактор, я получаю что-то вроде этого: head(SMOKE) # N N <NA> Y Y N # Levels: Y N...
21811 просмотров
schedule 18.05.2023

Отставание с отсутствующими данными
У меня есть набор данных о рейтингах одобрения на уровне штата. Мне нужно отставать от одной из переменных на два года. Данные являются годовыми и охватывают период с 1970 по 2008 год. Очевидно, что если я запаздываю с данными, я потеряю некоторые...
416 просмотров
schedule 15.07.2023

Не удается получить все результаты из SQL-запроса
Я пытаюсь создать запрос, используя файлы cookie (избранные элементы) <?php $favnum=0; $FavList = 'WHERE '; foreach ($_COOKIE as $name => $value) { if ($value == '1'){ if($name != 'PHPSESSID'){...
313 просмотров

Ошибка в 1:ncol(x): аргумент длины 0 при использовании Amelia в R
Я работаю с панельными данными. У меня есть более 6000 наблюдений за годом страны, и я уточнил мое вменение Амелии следующим образом: (CountDependentVariable, m=5, ts="year", cs="cowcode", sqrts=c("OtherCountVariable2",...
17802 просмотров
schedule 07.03.2022

R Отсутствующие значения
Я новичок в R и пытаюсь провести факторный анализ (метод = pca. Вращение = varimax и количество факторов равно 6). У меня есть данные опроса, которые я загрузил в R, а затем выбрал подмножество наблюдений и переменных. Я сделал следующее:...
2293 просмотров
schedule 24.05.2024

Как заставить Python изящно форматировать None и несуществующие поля [дубликаты]
Если я пишу на Python: data = {'n': 3, 'k': 3.141594, 'p': {'a': 7, 'b': 8}} print('{n}, {k:.2f}, {p[a]}, {p[b]}'.format(**data)) del data['k'] data['p']['b'] = None print('{n}, {k:.2f}, {p[a]}, {p[b]}'.format(**data)) Я получил: 3, 3.14,...
31483 просмотров
schedule 20.01.2024

Для NVD3 lineChart Удалить отсутствующие значения (чтобы иметь возможность интерполировать)
Я использую NVD3 для визуализации данных об экономическом неравенстве. Диаграмма для США находится здесь: http://www.chartbookofeconomicinequality.com/inequality-by-country/USA/ Это две диаграммы lineCharts, расположенные друг над другом....
3305 просмотров
schedule 20.01.2023

Гистограмма факторной переменной, включая пропущенные значения как уровень
У меня есть кадр данных с факториальной переменной, которая включает пропущенные значения. Я хотел бы построить гистограмму, включающую значения «a», «b», а также «NA» в качестве другого уровня. df1 <- data.frame(id = 1:6, fact1 =...
1585 просмотров
schedule 22.05.2023

XSLT: цикл for-each с ключом, не возвращающим все узлы
Я начинающий XSLT-разработчик. Меня попросили исправить проблему в проекте, в котором исходного разработчика больше нет с нами. В XSLT есть цикл for-each , использующий key и count . <xsl:for-each select="ns0:BOM[count(. | key('subsat',...
460 просмотров
schedule 12.11.2023

Заменить отсутствующие значения средним по столбцу
Я не уверен, как перебирать каждый столбец, чтобы заменить значения NA на среднее значение столбца. Когда я пытаюсь заменить один столбец следующим, он работает хорошо. Column1[is.na(Column1)] <- round(mean(Column1, na.rm = TRUE)) Код для...
158506 просмотров
schedule 23.02.2022

NA в функциях кластеризации (kmeans, pam, clara). Как связать кластеры с исходными данными?
Мне нужно сгруппировать некоторые данные, и я пробовал kmeans , pam и clara с R. Проблема в том, что мои данные находятся в столбце фрейма данных и содержат NA. Я использовал na.omit() для получения своих кластеров. Но тогда как я могу...
14529 просмотров
schedule 25.12.2023

Вычислить значения для отсутствующих строк
У меня есть SQL-запрос, который извлекает прогнозы в день. Если для данного «LP» отсутствует прогноз, я хотел бы рассчитать его на основе других прогнозов. Однако с приведенным ниже кодом он не рассчитывает прогнозы, когда они отсутствуют....
54 просмотров
schedule 25.03.2024

Присвоить значение отсутствующим данным, которых еще нет в массиве
У меня есть простой массив a , содержащий девять значений от 1 до 10 . Отсутствующей точке данных в этом массиве присваивается значение 0 . Мне нужно заменить это значение в массиве значением 0<x>10 , но, что особенно важно, это не...
158 просмотров
schedule 28.03.2023

param отсутствует или значение пустое: статус
Когда я пытаюсь отправить новый статус, я получаю следующее. У меня есть регистрационная форма, которая работает нормально, не знаю, что здесь происходит. Цените помощь. def status_params params.require(:status).permit(:type_id, :user_id) end...
582 просмотров

Комплект для разработки Java SE не установлен правильно?
Прежде всего, позвольте мне сказать, что я сделал все это во время просмотра этого видео: https://www.youtube.com/watch?v=Hl-zzrqQoSE Итак, я попробовал загрузить jdk-8u60 для 64-битной Windows, как показано здесь:...
783 просмотров
schedule 28.05.2022