Публикации по теме 'data-management'


Когда все идет наперекосяк: мысли о случайных данных
Вы, наверное, слышали о недавней аварии SpaceX Starship, когда беспилотная ракета взорвалась вскоре после запуска. Или, как они говорили, «пережил скорую незапланированную разборку». Я могу придумать множество способов распространить идею быстрого незапланированного события на другие вещи. Например, если вы бегун, «быстрая незапланированная эвакуация» во время гонки, вероятно, не нуждается в объяснении. Кажется, многие были удивлены, узнав, что SpaceX не изобрела этот термин. Он..

Проблемы и решения больших данных
Большие данные позволили организациям проверять значительные объемы структурированных и неструктурированных данных. Большие данные дополняют процесс принятия решений, предоставляя данные и выводы на основе спроецированной ценной информации. В настоящее время организации могут консолидировать свои данные с полученными большими наборами данных, такими как геопространственные данные. Настроения клиентов можно наблюдать, а изменения в выводах клиентов можно эффективно различать с помощью..

Подход Data Science к решению проблем
«Наука о данных включает в себя набор принципов, определений проблем, алгоритмов и процессов для извлечения неочевидных и полезных шаблонов из больших наборов данных» (Kelleher, 2019). Я закончил читать эту книгу около 6 месяцев назад. Хорошо написанное и отличное объяснение подхода к науке о данных во многих аспектах. Как консультант, работающий именно в области управления данными, имеющий дело с большими данными и программным обеспечением, книга дает некоторое представление о том,..

Управление зависимостями данных в приложениях на основе Redux | 2
Управление зависимостями данных — важная тема для меня. За годы работы с React, Redux и другими библиотеками из экосистемы мы разработали несколько решений этой проблемы. Вот наша история. В предыдущей статье я поделился с вами некоторой базовой информацией о технологиях, которые мы используем для создания приложений React, о том, как мы разделяем проблемы с помощью React , Redux и >редукс-сага . В этой статье я расскажу вам, как мы управляем зависимостями данных в наших..

🎉 Открытая бета-версия 🎉 - Панель инструментов компьютерного зрения на основе Pytorch
Мы рады представить на рынке самый эффективный набор инструментов для компьютерного зрения и аннотации изображений. За последние несколько месяцев наша команда разработала масштабируемую и производительную сквозную платформу для приложений компьютерного зрения. Мы рады перейти в открытую бета-версию с отличными бесплатными возможностями, доступными для каждого пользователя, и предоставить нашим клиентам обучение наиболее эффективным моделям данных. Создание Концепции В 2017 году на..

Вопросы по теме 'data-management'

Как лучше всего управлять метаданными в R?
При анализе данных чрезвычайно важны метаданные о переменных. Как вы управляете этой информацией в R? Например, есть ли способ указать метку, которая будет напечатана вместо имени переменной? Какие средства есть в R для этого?
2145 просмотров
schedule 30.07.2022

Разделить фрейм данных на перекрывающиеся фреймы данных
Я пытаюсь написать функцию, которая ведет себя следующим образом, но это оказывается очень сложно: DF <- data.frame(x = seq(1,10), y = rep(c('a','b','c','d','e'),2)) > DF x y 1 1 a 2 2 b 3 3 c 4 4 d 5 5 e 6 6 a 7 7 b 8 8...
1785 просмотров

Быстро удалить переменные с нулевой дисперсией из data.frame
У меня есть большой data.frame, созданный процессом, находящимся вне моего контроля, который может содержать или не содержать переменные с нулевой дисперсией (т.е. все наблюдения одинаковы). Я хотел бы построить прогностическую модель на основе этих...
33240 просмотров
schedule 15.04.2022

Как создать подмножество данных одного наблюдения за пациентом с наименьшей оценкой по переменной
Здравствуйте, у меня есть набор данных с несколькими пациентами, каждый из которых имеет несколько наблюдений. Я хочу выбрать самое раннее наблюдение для каждого пациента. Example: Patient ID Tender Swollen pt_visit 101 1...
255 просмотров
schedule 18.01.2023

Как обеспечить соблюдение зависимостей сущностей в среде SOA - сборка/загрузка?
При создании нескольких модульных и независимых сервисов я сталкиваюсь с зависимостями/сохраненными отношениями между сущностями. Учитывайте должность и сотрудника. В моей системе назначение сотрудника связано (URI) с должностью. В нашем...
83 просмотров

R: найти соответствующую строку, затем скопировать строку
У меня многоступенчатая проблема. Первый шаг: сопоставьте текст в одной строке (df1) из одного столбца с другим диапазоном столбцов (df2). Порядок совпадения столбцов отсутствует, и совпадение может произойти где угодно в пределах диапазона. Как...
1012 просмотров
schedule 05.06.2022

маркировка набора данных в машинном обучении
У меня есть вопрос о некоторых основных концепциях машинного обучения. Примеры, как я заметил, давали краткий обзор. Для обучения системы в качестве входных данных дается вектор признаков. В случае контролируемого обучения набор данных помечается....
2256 просмотров

Как преобразовать символ данных SAS в дату
У меня есть дата char '31DEC2015' в наборе SAS Data , и мне нужно преобразовать ее в формат даты . Как мне это сделать? Можно ли сделать шаг данных? Все, что я пробовал, дает мне нулевой результат.
122 просмотров
schedule 05.02.2023

переменная, показывающая наивысшее значение, достигнутое другой переменной, зарегистрированное до сих пор, с течением времени
У меня есть набор данных о пациентах и ​​их данных о пациентах, связанных с алкоголем, с течением времени (в годах), как показано ниже. clear input long patid float(year cohort) 1051 1994 1 2051 1972 1 2051 1989 2 2051 1990 2 2051 2000 2 2051 2001...
32 просмотров
schedule 15.12.2022

filter_at не работает при фильтрации любой переменной, которая НЕ соответствует критериям
Я пытаюсь использовать filter_at dplyr, чтобы отфильтровать любого человека, который был уволен в любой момент. Тем не менее, он продолжает давать мне неправильный ответ. Вот пример набора данных: problem <- tibble(name = c("Sally",...
100 просмотров
schedule 16.07.2022

Добавить столбец во фрейм данных с расчетом цикла из другого фрейма данных
У меня есть два набора данных, один на индивидуальном уровне и один на уровне школы. Я хотел бы рассчитать долю драк в каждой школе, используя цикл (поскольку у меня> 100 школ). Текущий код: for (i in levels(df$school_id)) { school <-...
22 просмотров

Как сделать ETL для миллионов строк данных с помощью python?
У меня есть база данных pgAdmin, которая содержит миллионы строк в формате geojson. Используя эту таблицу, я создаю панель инструментов Tableau. Поскольку строки содержат данные в формате geojson, я должен сделать такой запрос: select jsondata...
117 просмотров

#1 Объединение категорий категориальной переменной
Я хотел бы объединить некоторые названия бразильских политических партий из категориальной переменной (partido_pref), которая была неправильно закодирована. Категории, которые я хотел бы объединить, это «PC do B» и «PCdoB», а также «PT do B» и...
61 просмотров
schedule 15.04.2024

генерация двух столбцов со случайно поставленными 1,2 или 3, но разными значениями для каждой строки
Я хочу назначить 3 читателя для списка записей с ~ 1500 строками. Каждую строку необходимо опрашивать дважды, но не от одного и того же человека. Моя идея состояла в том, чтобы создать два новых столбца в наборе данных со случайными значениями 1,2...
55 просмотров
schedule 05.10.2022

Как оставить только строки, которые соответствуют определенному условию в R
У меня есть фрейм данных, который содержит около 700 случаев с 1800 обследованиями. Некоторые случаи прошли несколько различных модальностей. Я хочу оставить только один результат обследования, основанный на конкретном условии модальности. Вот...
30 просмотров