Вопросы по теме 'data.table'
Как выполнить операцию слияния data.table
примечание: этот вопрос и следующие ответы относятся к версиям data.table ‹1.5.3; Версия 1.5.3 была выпущена в феврале 2011 года для решения этой проблемы. см. более позднюю обработку (03-2012): Преобразование SQL-соединений по внешним ключам в...
89077 просмотров
schedule
23.04.2022
Какой самый быстрый способ объединить / объединить data.frames в R?
Например (не уверен, что это наиболее репрезентативный пример):
N <- 1e6
d1 <- data.frame(x=sample(N,N), y1=rnorm(N))
d2 <- data.frame(x=sample(N,N), y2=rnorm(N))
Вот что у меня есть на данный момент:
d <- merge(d1,d2)
# 7.6...
47552 просмотров
schedule
30.12.2021
Применение агрегатной функции к нескольким различным срезам
У меня есть массив данных, который содержит некоторую информацию о людях и проектах как таковых:
person_id | project_id | action | time
--------------------------------------
1 | 1 | w | 1
1 | 2 | w |...
687 просмотров
schedule
20.06.2023
не присоединяется к data.tables
У меня есть вопрос по идиоме data.table для "не присоединений", вдохновленный вопросом Iterator. Вот пример:
library(data.table)
dt1 <- data.table(A1=letters[1:10], B1=sample(1:5,10, replace=TRUE))
dt2 <- data.table(A2=letters[c(1:5,...
1852 просмотров
schedule
24.03.2022
Агрегировать / суммировать несколько переменных для каждой группы (например, сумма, среднее значение)
Есть ли простой способ агрегировать ( sum , mean , max и т. Д.) Несколько переменных одновременно из фрейма данных?
Ниже приведены некоторые примеры данных:
library(lubridate)
days = 365*2
date = seq(as.Date("2000-01-01"), length = days, by...
198523 просмотров
schedule
01.11.2022
Суммирование строк на основе определенных комбинаций факторов
Вероятно, это глупый вопрос, но я прочитал главу Кроули о фреймах данных и прошерстил Интернет, но пока ничего не смог заставить работать.
Вот пример набора данных, похожий на мой:
> data<-data.frame(site=c("A","A","A","A","B","B"),...
14728 просмотров
schedule
23.06.2023
R: передача кадра данных по ссылке
R имеет семантику передачи по значению, которая сводит к минимуму случайные побочные эффекты (хорошо). Однако, когда код организован во множество функций / методов для повторного использования / читабельности / ремонтопригодности и когда этому коду...
13388 просмотров
schedule
26.10.2023
Передача выражения во вложенную группировку в data.table
У меня есть объект data.table , похожий на этот
library(data.table)
c <- data.table(CO = c(10000,10000,10000,20000,20000,20000,20000),
SH = c(1427,1333,1333,1000,1000,300,350),
PRC =...
623 просмотров
schedule
25.02.2023
R: Общее сведение JSON к data.frame
Этот вопрос касается общего механизма преобразования любого набора нециклических однородных или разнородных структур данных в кадр данных. Это может быть особенно полезно при работе с большим количеством документов JSON или с большим документом JSON,...
10570 просмотров
schedule
25.03.2023
Подмножество строки и столбца одновременно
Я немного удивлен тем, как работает data.table :
> library(data.table)
data.table 1.8.2 For help type: help("data.table")
> dt <- data.table(a=11:20, b=21:30, c=31:40, key="a")
> dt[list(12)]
a b c
1: 12 22 32
> dt[list(12),...
1082 просмотров
schedule
13.03.2024
R data.table setkey с числовым столбцом
Я использую пакет data.table в R. При попытке использовать setkey в числовом столбце я получаю следующее сообщение об ошибке:
setkey(candidate.SNPs.MAF, p)
Error in setkeyv(x, cols, verbose = verbose) :
Column 'p' cannot be coerced to integer...
1497 просмотров
schedule
04.05.2024
уменьшить строку до уникальных элементов
у меня есть кадр данных
test <- structure(list(
y2002 = c("freshman","freshman","freshman","sophomore","sophomore","senior"),
y2003 = c("freshman","junior","junior","sophomore","sophomore","senior"),
y2004 =...
194 просмотров
schedule
19.03.2022
Как получить длину текущей группы в группировке data.table?
Я знаю, что этого можно достичь с помощью других пакетов, но я пытаюсь сделать это в data.table (так как это кажется самым быстрым для группировки).
library(data.table)
dt = data.table(a=c(1,2,2,3))
dt[,length(a),by=a]
приводит к
a...
4679 просмотров
schedule
21.03.2024
Подобрать верхнюю и нижнюю линии процентилей
У меня есть данные, которые примерно так выглядят (не умею вставлять графики):
library(reshape2)
library(ggplot2)
df <- cbind(runif(2000,0,1000), rep(0,n=2000))
for (i in 1:nrow(df)) {
df[i,2] <- runif(1, df[i,1], (10000-2*df[i,1]))
}...
1659 просмотров
schedule
17.03.2022
Обновите более одного столбца таблицы данных.
Можно ли обновить более 1 столбца таблицы данных в одном операторе?
Что-то типа
dt[,onecol:=1 anothercol:=2]
Я видел несколько примеров, когда они
dt[,c("onecol","anothercol"):=1]
но я не знаю, как назначить разные формулы для...
290 просмотров
schedule
01.08.2022
Подмножество data.table по 2-му столбцу только 2-столбцового ключа с использованием двоичного поиска, а не векторного сканирования
Недавно я обнаружил бинарный поиск в data.table . Если таблица отсортирована по нескольким ключам, можно ли искать только по второму ключу?
DT = data.table(x=sample(letters,1e7,T),y=sample(1:25,1e7,T),rnorm(1e7))
setkey(DT,x,y)
#R>...
4068 просмотров
schedule
14.11.2023
Выполнение операций над подмножеством с использованием таблицы данных
У меня есть набор данных опроса в широкой форме. Для конкретного вопроса в необработанных данных был создан набор переменных, чтобы отразить тот факт, что вопрос опроса был задан в определенном месяце.
Я хочу создать новый набор переменных с...
521 просмотров
schedule
16.11.2023
когда plyr лучше, чем data.table?
Лучше здесь может означать более быстрый или легкий для чтения/более короткий синтаксис, или это также может означать, что команда даже не выполнима в data.table .
Я не использую plyr часто и хотел бы знать, есть ли случаи, когда я должен это...
3872 просмотров
schedule
09.07.2023
data.table: использование setkey с переменной имени столбца
У меня есть имя переменной, сохраненное в строковой переменной which_id .
W - это таблица данных. Как мне позвонить setkey на W с which_id ?
Это то, что я пробовал
> eval( paste( 'setkey(W,' , which_id , ')' ) )
[1] "setkey(W,...
7477 просмотров
schedule
14.03.2022
Идиома для удаления одного столбца в data.table
Мне нужно удалить один столбец из data.frame, содержащего несколько сотен столбцов.
С data.frame я бы использовал subset , чтобы сделать это удобно:
> dat <- data.table( data.frame(x=runif(10),y=rep(letters[1:5],2),z=runif(10)),key='y'...
344 просмотров
schedule
10.07.2022