Публикации по теме 'data-management'
Когда все идет наперекосяк: мысли о случайных данных
Вы, наверное, слышали о недавней аварии SpaceX Starship, когда беспилотная ракета взорвалась вскоре после запуска. Или, как они говорили, «пережил скорую незапланированную разборку».
Я могу придумать множество способов распространить идею быстрого незапланированного события на другие вещи. Например, если вы бегун, «быстрая незапланированная эвакуация» во время гонки, вероятно, не нуждается в объяснении.
Кажется, многие были удивлены, узнав, что SpaceX не изобрела этот термин. Он..
Проблемы и решения больших данных
Большие данные позволили организациям проверять значительные объемы структурированных и неструктурированных данных. Большие данные дополняют процесс принятия решений, предоставляя данные и выводы на основе спроецированной ценной информации. В настоящее время организации могут консолидировать свои данные с полученными большими наборами данных, такими как геопространственные данные. Настроения клиентов можно наблюдать, а изменения в выводах клиентов можно эффективно различать с помощью..
Подход Data Science к решению проблем
«Наука о данных включает в себя набор принципов, определений проблем, алгоритмов и процессов для извлечения неочевидных и полезных шаблонов из больших наборов данных» (Kelleher, 2019).
Я закончил читать эту книгу около 6 месяцев назад. Хорошо написанное и отличное объяснение подхода к науке о данных во многих аспектах. Как консультант, работающий именно в области управления данными, имеющий дело с большими данными и программным обеспечением, книга дает некоторое представление о том,..
Управление зависимостями данных в приложениях на основе Redux | 2
Управление зависимостями данных — важная тема для меня. За годы работы с React, Redux и другими библиотеками из экосистемы мы разработали несколько решений этой проблемы. Вот наша история.
В предыдущей статье я поделился с вами некоторой базовой информацией о технологиях, которые мы используем для создания приложений React, о том, как мы разделяем проблемы с помощью React , Redux и >редукс-сага . В этой статье я расскажу вам, как мы управляем зависимостями данных в наших..
🎉 Открытая бета-версия 🎉 - Панель инструментов компьютерного зрения на основе Pytorch
Мы рады представить на рынке самый эффективный набор инструментов для компьютерного зрения и аннотации изображений. За последние несколько месяцев наша команда разработала масштабируемую и производительную сквозную платформу для приложений компьютерного зрения. Мы рады перейти в открытую бета-версию с отличными бесплатными возможностями, доступными для каждого пользователя, и предоставить нашим клиентам обучение наиболее эффективным моделям данных.
Создание Концепции
В 2017 году на..
Вопросы по теме 'data-management'
Как лучше всего управлять метаданными в R?
При анализе данных чрезвычайно важны метаданные о переменных. Как вы управляете этой информацией в R?
Например, есть ли способ указать метку, которая будет напечатана вместо имени переменной?
Какие средства есть в R для этого?
2145 просмотров
schedule
30.07.2022
Разделить фрейм данных на перекрывающиеся фреймы данных
Я пытаюсь написать функцию, которая ведет себя следующим образом, но это оказывается очень сложно:
DF <- data.frame(x = seq(1,10), y = rep(c('a','b','c','d','e'),2))
> DF
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
7 7 b
8 8...
1785 просмотров
schedule
18.12.2022
Быстро удалить переменные с нулевой дисперсией из data.frame
У меня есть большой data.frame, созданный процессом, находящимся вне моего контроля, который может содержать или не содержать переменные с нулевой дисперсией (т.е. все наблюдения одинаковы). Я хотел бы построить прогностическую модель на основе этих...
33240 просмотров
schedule
15.04.2022
Как создать подмножество данных одного наблюдения за пациентом с наименьшей оценкой по переменной
Здравствуйте, у меня есть набор данных с несколькими пациентами, каждый из которых имеет несколько наблюдений. Я хочу выбрать самое раннее наблюдение для каждого пациента.
Example:
Patient ID Tender Swollen pt_visit
101 1...
255 просмотров
schedule
18.01.2023
Как обеспечить соблюдение зависимостей сущностей в среде SOA - сборка/загрузка?
При создании нескольких модульных и независимых сервисов я сталкиваюсь с зависимостями/сохраненными отношениями между сущностями. Учитывайте должность и сотрудника. В моей системе назначение сотрудника связано (URI) с должностью.
В нашем...
83 просмотров
schedule
06.02.2023
R: найти соответствующую строку, затем скопировать строку
У меня многоступенчатая проблема. Первый шаг: сопоставьте текст в одной строке (df1) из одного столбца с другим диапазоном столбцов (df2). Порядок совпадения столбцов отсутствует, и совпадение может произойти где угодно в пределах диапазона. Как...
1012 просмотров
schedule
05.06.2022
маркировка набора данных в машинном обучении
У меня есть вопрос о некоторых основных концепциях машинного обучения. Примеры, как я заметил, давали краткий обзор. Для обучения системы в качестве входных данных дается вектор признаков. В случае контролируемого обучения набор данных помечается....
2256 просмотров
schedule
14.08.2022
Как преобразовать символ данных SAS в дату
У меня есть дата char '31DEC2015' в наборе SAS Data , и мне нужно преобразовать ее в формат даты . Как мне это сделать? Можно ли сделать шаг данных? Все, что я пробовал, дает мне нулевой результат.
122 просмотров
schedule
05.02.2023
переменная, показывающая наивысшее значение, достигнутое другой переменной, зарегистрированное до сих пор, с течением времени
У меня есть набор данных о пациентах и их данных о пациентах, связанных с алкоголем, с течением времени (в годах), как показано ниже.
clear
input long patid float(year cohort)
1051 1994 1
2051 1972 1
2051 1989 2
2051 1990 2
2051 2000 2
2051 2001...
32 просмотров
schedule
15.12.2022
filter_at не работает при фильтрации любой переменной, которая НЕ соответствует критериям
Я пытаюсь использовать filter_at dplyr, чтобы отфильтровать любого человека, который был уволен в любой момент. Тем не менее, он продолжает давать мне неправильный ответ.
Вот пример набора данных:
problem <- tibble(name = c("Sally",...
100 просмотров
schedule
16.07.2022
Добавить столбец во фрейм данных с расчетом цикла из другого фрейма данных
У меня есть два набора данных, один на индивидуальном уровне и один на уровне школы. Я хотел бы рассчитать долю драк в каждой школе, используя цикл (поскольку у меня> 100 школ).
Текущий код:
for (i in levels(df$school_id)) {
school <-...
22 просмотров
schedule
30.08.2023
Как сделать ETL для миллионов строк данных с помощью python?
У меня есть база данных pgAdmin, которая содержит миллионы строк в формате geojson. Используя эту таблицу, я создаю панель инструментов Tableau. Поскольку строки содержат данные в формате geojson, я должен сделать такой запрос:
select jsondata...
117 просмотров
schedule
13.02.2024
#1 Объединение категорий категориальной переменной
Я хотел бы объединить некоторые названия бразильских политических партий из категориальной переменной (partido_pref), которая была неправильно закодирована.
Категории, которые я хотел бы объединить, это «PC do B» и «PCdoB», а также «PT do B» и...
61 просмотров
schedule
15.04.2024
генерация двух столбцов со случайно поставленными 1,2 или 3, но разными значениями для каждой строки
Я хочу назначить 3 читателя для списка записей с ~ 1500 строками. Каждую строку необходимо опрашивать дважды, но не от одного и того же человека. Моя идея состояла в том, чтобы создать два новых столбца в наборе данных со случайными значениями 1,2...
55 просмотров
schedule
05.10.2022
Как оставить только строки, которые соответствуют определенному условию в R
У меня есть фрейм данных, который содержит около 700 случаев с 1800 обследованиями. Некоторые случаи прошли несколько различных модальностей. Я хочу оставить только один результат обследования, основанный на конкретном условии модальности.
Вот...
30 просмотров
schedule
08.12.2022