Статьи по теме data-management

Публикации по теме 'data-management'

Когда все идет наперекосяк: мысли о случайных данных

Вы, наверное, слышали о недавней аварии SpaceX Starship, когда беспилотная ракета взорвалась вскоре после запуска. Или, как они говорили, «пережил скорую незапланированную разборку». Я могу придумать множество способов распространить идею быстрого незапланированного события на другие вещи. Например, если вы бегун, «быстрая незапланированная эвакуация» во время гонки, вероятно, не нуждается в объяснении. Кажется, многие были удивлены, узнав, что SpaceX не изобрела этот термин. Он..

Проблемы и решения больших данных

Большие данные позволили организациям проверять значительные объемы структурированных и неструктурированных данных. Большие данные дополняют процесс принятия решений, предоставляя данные и выводы на основе спроецированной ценной информации. В настоящее время организации могут консолидировать свои данные с полученными большими наборами данных, такими как геопространственные данные. Настроения клиентов можно наблюдать, а изменения в выводах клиентов можно эффективно различать с помощью..

Подход Data Science к решению проблем

«Наука о данных включает в себя набор принципов, определений проблем, алгоритмов и процессов для извлечения неочевидных и полезных шаблонов из больших наборов данных» (Kelleher, 2019). Я закончил читать эту книгу около 6 месяцев назад. Хорошо написанное и отличное объяснение подхода к науке о данных во многих аспектах. Как консультант, работающий именно в области управления данными, имеющий дело с большими данными и программным обеспечением, книга дает некоторое представление о том,..

Управление зависимостями данных в приложениях на основе Redux | 2

Управление зависимостями данных — важная тема для меня. За годы работы с React, Redux и другими библиотеками из экосистемы мы разработали несколько решений этой проблемы. Вот наша история. В предыдущей статье я поделился с вами некоторой базовой информацией о технологиях, которые мы используем для создания приложений React, о том, как мы разделяем проблемы с помощью React , Redux и >редукс-сага . В этой статье я расскажу вам, как мы управляем зависимостями данных в наших..

🎉 Открытая бета-версия 🎉 - Панель инструментов компьютерного зрения на основе Pytorch

Мы рады представить на рынке самый эффективный набор инструментов для компьютерного зрения и аннотации изображений. За последние несколько месяцев наша команда разработала масштабируемую и производительную сквозную платформу для приложений компьютерного зрения. Мы рады перейти в открытую бета-версию с отличными бесплатными возможностями, доступными для каждого пользователя, и предоставить нашим клиентам обучение наиболее эффективным моделям данных. Создание Концепции В 2017 году на..

Вопросы по теме 'data-management'

Как лучше всего управлять метаданными в R?

При анализе данных чрезвычайно важны метаданные о переменных. Как вы управляете этой информацией в R? Например, есть ли способ указать метку, которая будет напечатана вместо имени переменной? Какие средства есть в R для этого?

2145 просмотров

r data-management

30.07.2022

Разделить фрейм данных на перекрывающиеся фреймы данных

Я пытаюсь написать функцию, которая ведет себя следующим образом, но это оказывается очень сложно: DF <- data.frame(x = seq(1,10), y = rep(c('a','b','c','d','e'),2)) > DF x y 1 1 a 2 2 b 3 3 c 4 4 d 5 5 e 6 6 a 7 7 b 8 8...

1785 просмотров

r dataframe data-manipulation data-management

18.12.2022

Быстро удалить переменные с нулевой дисперсией из data.frame

У меня есть большой data.frame, созданный процессом, находящимся вне моего контроля, который может содержать или не содержать переменные с нулевой дисперсией (т.е. все наблюдения одинаковы). Я хотел бы построить прогностическую модель на основе этих...

33240 просмотров

r data-management

15.04.2022

Как создать подмножество данных одного наблюдения за пациентом с наименьшей оценкой по переменной

Здравствуйте, у меня есть набор данных с несколькими пациентами, каждый из которых имеет несколько наблюдений. Я хочу выбрать самое раннее наблюдение для каждого пациента. Example: Patient ID Tender Swollen pt_visit 101 1...

255 просмотров

r dataframe subset data-management

18.01.2023

Как обеспечить соблюдение зависимостей сущностей в среде SOA - сборка/загрузка?

При создании нескольких модульных и независимых сервисов я сталкиваюсь с зависимостями/сохраненными отношениями между сущностями. Учитывайте должность и сотрудника. В моей системе назначение сотрудника связано (URI) с должностью. В нашем...

83 просмотров

constraints web-services data-management soa foreign-key-relationship

06.02.2023

R: найти соответствующую строку, затем скопировать строку

У меня многоступенчатая проблема. Первый шаг: сопоставьте текст в одной строке (df1) из одного столбца с другим диапазоном столбцов (df2). Порядок совпадения столбцов отсутствует, и совпадение может произойти где угодно в пределах диапазона. Как...

1012 просмотров

r formatting match data-management

05.06.2022

маркировка набора данных в машинном обучении

У меня есть вопрос о некоторых основных концепциях машинного обучения. Примеры, как я заметил, давали краткий обзор. Для обучения системы в качестве входных данных дается вектор признаков. В случае контролируемого обучения набор данных помечается....

2256 просмотров

machine-learning data-management supervised-learning

14.08.2022

Как преобразовать символ данных SAS в дату

У меня есть дата char '31DEC2015' в наборе SAS Data , и мне нужно преобразовать ее в формат даты . Как мне это сделать? Можно ли сделать шаг данных? Все, что я пробовал, дает мне нулевой результат.

122 просмотров

sas data-management

05.02.2023

переменная, показывающая наивысшее значение, достигнутое другой переменной, зарегистрированное до сих пор, с течением времени

У меня есть набор данных о пациентах и их данных о пациентах, связанных с алкоголем, с течением времени (в годах), как показано ниже. clear input long patid float(year cohort) 1051 1994 1 2051 1972 1 2051 1989 2 2051 1990 2 2051 2000 2 2051 2001...

32 просмотров

stata data-management

15.12.2022

filter_at не работает при фильтрации любой переменной, которая НЕ соответствует критериям

Я пытаюсь использовать filter_at dplyr, чтобы отфильтровать любого человека, который был уволен в любой момент. Тем не менее, он продолжает давать мне неправильный ответ. Вот пример набора данных: problem <- tibble(name = c("Sally",...

100 просмотров

r dplyr data-management

16.07.2022

Добавить столбец во фрейм данных с расчетом цикла из другого фрейма данных

У меня есть два набора данных, один на индивидуальном уровне и один на уровне школы. Я хотел бы рассчитать долю драк в каждой школе, используя цикл (поскольку у меня> 100 школ). Текущий код: for (i in levels(df$school_id)) { school <-...

22 просмотров

r for-loop data-manipulation data-management

30.08.2023

Как сделать ETL для миллионов строк данных с помощью python?

У меня есть база данных pgAdmin, которая содержит миллионы строк в формате geojson. Используя эту таблицу, я создаю панель инструментов Tableau. Поскольку строки содержат данные в формате geojson, я должен сделать такой запрос: select jsondata...

117 просмотров

python etl data-processing data-management python-datamodel

13.02.2024

#1 Объединение категорий категориальной переменной

Я хотел бы объединить некоторые названия бразильских политических партий из категориальной переменной (partido_pref), которая была неправильно закодирована. Категории, которые я хотел бы объединить, это «PC do B» и «PCdoB», а также «PT do B» и...

61 просмотров

r categorical-data stata data-management

15.04.2024

генерация двух столбцов со случайно поставленными 1,2 или 3, но разными значениями для каждой строки

Я хочу назначить 3 читателя для списка записей с ~ 1500 строками. Каждую строку необходимо опрашивать дважды, но не от одного и того же человека. Моя идея состояла в том, чтобы создать два новых столбца в наборе данных со случайными значениями 1,2...

55 просмотров

r random duplicates data-management

05.10.2022

Как оставить только строки, которые соответствуют определенному условию в R

У меня есть фрейм данных, который содержит около 700 случаев с 1800 обследованиями. Некоторые случаи прошли несколько различных модальностей. Я хочу оставить только один результат обследования, основанный на конкретном условии модальности. Вот...

30 просмотров

r conditional-statements dataframe data-management

08.12.2022