Вопросы по теме 'data.table'

Как выполнить операцию слияния data.table
примечание: этот вопрос и следующие ответы относятся к версиям data.table ‹1.5.3; Версия 1.5.3 была выпущена в феврале 2011 года для решения этой проблемы. см. более позднюю обработку (03-2012): Преобразование SQL-соединений по внешним ключам в...
89077 просмотров
schedule 23.04.2022

Какой самый быстрый способ объединить / объединить data.frames в R?
Например (не уверен, что это наиболее репрезентативный пример): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Вот что у меня есть на данный момент: d <- merge(d1,d2) # 7.6...
47552 просмотров
schedule 30.12.2021

Применение агрегатной функции к нескольким различным срезам
У меня есть массив данных, который содержит некоторую информацию о людях и проектах как таковых: person_id | project_id | action | time -------------------------------------- 1 | 1 | w | 1 1 | 2 | w |...
687 просмотров
schedule 20.06.2023

не присоединяется к data.tables
У меня есть вопрос по идиоме data.table для "не присоединений", вдохновленный вопросом Iterator. Вот пример: library(data.table) dt1 <- data.table(A1=letters[1:10], B1=sample(1:5,10, replace=TRUE)) dt2 <- data.table(A2=letters[c(1:5,...
1852 просмотров
schedule 24.03.2022

Агрегировать / суммировать несколько переменных для каждой группы (например, сумма, среднее значение)
Есть ли простой способ агрегировать ( sum , mean , max и т. Д.) Несколько переменных одновременно из фрейма данных? Ниже приведены некоторые примеры данных: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by...
198523 просмотров
schedule 01.11.2022

Суммирование строк на основе определенных комбинаций факторов
Вероятно, это глупый вопрос, но я прочитал главу Кроули о фреймах данных и прошерстил Интернет, но пока ничего не смог заставить работать. Вот пример набора данных, похожий на мой: > data<-data.frame(site=c("A","A","A","A","B","B"),...
14728 просмотров
schedule 23.06.2023

R: передача кадра данных по ссылке
R имеет семантику передачи по значению, которая сводит к минимуму случайные побочные эффекты (хорошо). Однако, когда код организован во множество функций / методов для повторного использования / читабельности / ремонтопригодности и когда этому коду...
13388 просмотров
schedule 26.10.2023

Передача выражения во вложенную группировку в data.table
У меня есть объект data.table , похожий на этот library(data.table) c <- data.table(CO = c(10000,10000,10000,20000,20000,20000,20000), SH = c(1427,1333,1333,1000,1000,300,350), PRC =...
623 просмотров
schedule 25.02.2023

R: Общее сведение JSON к data.frame
Этот вопрос касается общего механизма преобразования любого набора нециклических однородных или разнородных структур данных в кадр данных. Это может быть особенно полезно при работе с большим количеством документов JSON или с большим документом JSON,...
10570 просмотров
schedule 25.03.2023

Подмножество строки и столбца одновременно
Я немного удивлен тем, как работает data.table : > library(data.table) data.table 1.8.2 For help type: help("data.table") > dt <- data.table(a=11:20, b=21:30, c=31:40, key="a") > dt[list(12)] a b c 1: 12 22 32 > dt[list(12),...
1082 просмотров
schedule 13.03.2024

R data.table setkey с числовым столбцом
Я использую пакет data.table в R. При попытке использовать setkey в числовом столбце я получаю следующее сообщение об ошибке: setkey(candidate.SNPs.MAF, p) Error in setkeyv(x, cols, verbose = verbose) : Column 'p' cannot be coerced to integer...
1497 просмотров
schedule 04.05.2024

уменьшить строку до уникальных элементов
у меня есть кадр данных test <- structure(list( y2002 = c("freshman","freshman","freshman","sophomore","sophomore","senior"), y2003 = c("freshman","junior","junior","sophomore","sophomore","senior"), y2004 =...
194 просмотров
schedule 19.03.2022

Как получить длину текущей группы в группировке data.table?
Я знаю, что этого можно достичь с помощью других пакетов, но я пытаюсь сделать это в data.table (так как это кажется самым быстрым для группировки). library(data.table) dt = data.table(a=c(1,2,2,3)) dt[,length(a),by=a] приводит к a...
4679 просмотров
schedule 21.03.2024

Подобрать верхнюю и нижнюю линии процентилей
У меня есть данные, которые примерно так выглядят (не умею вставлять графики): library(reshape2) library(ggplot2) df <- cbind(runif(2000,0,1000), rep(0,n=2000)) for (i in 1:nrow(df)) { df[i,2] <- runif(1, df[i,1], (10000-2*df[i,1])) }...
1659 просмотров
schedule 17.03.2022

Обновите более одного столбца таблицы данных.
Можно ли обновить более 1 столбца таблицы данных в одном операторе? Что-то типа dt[,onecol:=1 anothercol:=2] Я видел несколько примеров, когда они dt[,c("onecol","anothercol"):=1] но я не знаю, как назначить разные формулы для...
290 просмотров
schedule 01.08.2022

Подмножество data.table по 2-му столбцу только 2-столбцового ключа с использованием двоичного поиска, а не векторного сканирования
Недавно я обнаружил бинарный поиск в data.table . Если таблица отсортирована по нескольким ключам, можно ли искать только по второму ключу? DT = data.table(x=sample(letters,1e7,T),y=sample(1:25,1e7,T),rnorm(1e7)) setkey(DT,x,y) #R>...
4068 просмотров
schedule 14.11.2023

Выполнение операций над подмножеством с использованием таблицы данных
У меня есть набор данных опроса в широкой форме. Для конкретного вопроса в необработанных данных был создан набор переменных, чтобы отразить тот факт, что вопрос опроса был задан в определенном месяце. Я хочу создать новый набор переменных с...
521 просмотров
schedule 16.11.2023

когда plyr лучше, чем data.table?
Лучше здесь может означать более быстрый или легкий для чтения/более короткий синтаксис, или это также может означать, что команда даже не выполнима в data.table . Я не использую plyr часто и хотел бы знать, есть ли случаи, когда я должен это...
3872 просмотров
schedule 09.07.2023

data.table: использование setkey с переменной имени столбца
У меня есть имя переменной, сохраненное в строковой переменной which_id . W - это таблица данных. Как мне позвонить setkey на W с which_id ? Это то, что я пробовал > eval( paste( 'setkey(W,' , which_id , ')' ) ) [1] "setkey(W,...
7477 просмотров
schedule 14.03.2022

Идиома для удаления одного столбца в data.table
Мне нужно удалить один столбец из data.frame, содержащего несколько сотен столбцов. С data.frame я бы использовал subset , чтобы сделать это удобно: > dat <- data.table( data.frame(x=runif(10),y=rep(letters[1:5],2),z=runif(10)),key='y'...
344 просмотров
schedule 10.07.2022