Вопросы по теме 'plyr'
R: групповое ускорение по операциям
У меня есть симуляция, которая имеет огромный агрегат и комбинирует шаг прямо посередине. Я прототипировал этот процесс, используя функцию plyr ddply (), которая отлично подходит для огромного процента моих потребностей. Но мне нужно, чтобы этот...
9562 просмотров
schedule
23.01.2024
plyrsummary вызывает только глобальные функции
Я пытаюсь передать функцию (weight.func) другой функции (оболочке), которая вызывает ddply. Я хочу, чтобы ddply использовал эту функцию (weight.func) как часть своих вычислений. Я получаю результат, который хочу, когда weight.func установлен...
373 просмотров
schedule
21.05.2022
Извлечение RMSE из объекта lmList
У меня есть следующий код для извлечения коэффициентов из объекта lmList.
library(lme4)
library(plyr)
lm.model <- lmList(Y ~ X | eventID, df)
param <- ldply(lm.model, coef)
Этот код работает нормально. Однако является ли это...
1656 просмотров
schedule
03.12.2022
Как переписать команду sapply для повышения производительности?
У меня есть data.frame с именем «d» из ~ 1 300 000 строк и 4 столбца и еще один data.frame с именем «gc» из ~ 12 000 строк и 2 столбца (но см. меньший пример ниже).
d <- data.frame( gene=rep(c("a","b","c"),4), val=rnorm(12), ind=c(...
503 просмотров
schedule
10.10.2022
ddply возвращает слишком много результатов
По какой-то причине я получаю больше результатов, чем ожидал, после обновления до R-2.13.0 - и обновления до plyr_1.5.1.tar.gz... Я попробовал это на старой версии plyr (версия неизвестна, к сожалению, поскольку Я просто перезаписал...)...
233 просмотров
schedule
04.05.2024
Среднее значение элементов в списке data.frames
Предположим, у меня есть список data.frames (равных строк и столбцов)
dat1 <- as.data.frame(matrix(rnorm(25), ncol=5))
dat2 <- as.data.frame(matrix(rnorm(25), ncol=5))
dat3 <- as.data.frame(matrix(rnorm(25), ncol=5))
all.dat <-...
19456 просмотров
schedule
03.06.2023
Группировка переменных R на основе подгрупп
У меня есть данные в формате
PERSON_A PERSON_B MEET LEAVE
В основном это описывает, когда ЛИЦО_А встретил ЛИЦО_Б во время ВСТРЕЧИ, и они сказали друг другу «до свидания» в момент ВЫЙТИ. Время выражено в секундах, и небольшая часть данных...
213 просмотров
schedule
12.11.2023
Суммирование строк на основе определенных комбинаций факторов
Вероятно, это глупый вопрос, но я прочитал главу Кроули о фреймах данных и прошерстил Интернет, но пока ничего не смог заставить работать.
Вот пример набора данных, похожий на мой:
> data<-data.frame(site=c("A","A","A","A","B","B"),...
14728 просмотров
schedule
23.06.2023
Как ограничить время ожидания, если элемент списка не работает или занимает слишком много времени?
Для нескольких усилий, в которых я сейчас участвую, я запускаю большие наборы данных с многочисленными комбинациями параметров с помощью ряда функций. У функций есть оболочка (так что я могу mclapply ) для простоты работы в кластере. Однако я...
435 просмотров
schedule
18.06.2023
Извлеките индексы верхних n-х значений для каждого элемента в кадре данных
У меня есть временная отметка о 4 студентах, отвечающих на онлайн-анкету в кадре данных. 1-й столбец — это время, 2-й — идентификатор студента (id: 1,2,3,4). Ниже приведен смоделированный кадр данных:
DF <- data.frame(cbind(Time=1:60,...
951 просмотров
schedule
06.09.2023
Самый простой способ вычитания, связанного с одним уровнем фактора, из значений, связанных со всеми другими уровнями фактора.
У меня есть фрейм данных, содержащий ставки на «живое» лечение и ставки на «убитое» лечение. Я хотел бы вычесть убитые обработки из живых:
df <- data.frame(id1=gl(2, 3, labels=c("a", "b")),
id2=rep(gl(3, 1, labels=c("live1",...
3121 просмотров
schedule
06.12.2022
Почему в dlply (в пакете R plyr) нет индикатора выполнения
Я использую пакет plyr для обработки списков и фреймов данных. Я заметил следующее поведение:
Пример 1 -
list_2 <- llply(list_1, function_1, .progress='text')
это работает так, как ожидалось. Он генерирует список_2 из списка_1 с...
1014 просмотров
schedule
11.02.2023
Использование dlply с pROC
Я пытаюсь применить функцию roc() из пакета pROC к определенным переменным из фрейма данных df , подмножества на df$site , состоящего из символов, которые выглядят как «01», «02», «03». Функция roc() возвращает список, поэтому я ожидаю, что мой...
110 просмотров
schedule
01.07.2023
R: Общее сведение JSON к data.frame
Этот вопрос касается общего механизма преобразования любого набора нециклических однородных или разнородных структур данных в кадр данных. Это может быть особенно полезно при работе с большим количеством документов JSON или с большим документом JSON,...
10570 просмотров
schedule
25.03.2023
Измените фрейм данных с несколькими элементами в каждой позиции в фрейме данных
Фактически это продолжение предыдущего вопроса:
Сплайн по нескольким факторам во фрейме данных
так что извиняюсь за повторное прохождение первой части. И поверьте, я пытался решить сам!
Итак, некоторые образцы данных:
mydf<-...
102 просмотров
schedule
05.10.2022
функция запуска в каждой строке, которая возвращает несколько строк R
После долгих экспериментов и поиска в Google ... и повторных экспериментов, я наконец-то задаю свой первый вопрос о StackOverflow :)
У меня есть data.frame, и я хочу применить пользовательскую функцию expandBases к каждой строке data.frame....
1414 просмотров
schedule
05.06.2023
Как преобразовать вложенный список
У меня есть вложенный список и мне нужно вычислить корреляцию frt и srt
$`bs. bs`
fapp frt sapp srt
1 bs 2280 bs 0.25
2 bs 2287 bs 0.25
3 bs 2288 bs 0.25
4 bs 2289 bs 0.25
$`bs. lhc`
fapp frt sapp srt
5 bs...
1174 просмотров
schedule
03.12.2022
which.min в dcast () reshape2?
Я хотел бы извлечь значение var2, которое соответствует минимальному значению var1 в каждой комбинации строительного месяца. Вот мой (поддельный) набор данных:
head(mydata)
# building month var1 var2
#1 A 1 -26.96333...
223 просмотров
schedule
18.07.2023
Вызов различных элементов списка в plyr
У меня есть код, который выглядит так
reps=128
results = llply(1:reps, function(idx){out<-single.imputation(start.data)},.parallel=TRUE)
start.data — это список со значениями от 1 до 128. Как мне это закодировать, чтобы каждый...
64 просмотров
schedule
23.05.2022
Выполнение операций над подмножеством с использованием таблицы данных
У меня есть набор данных опроса в широкой форме. Для конкретного вопроса в необработанных данных был создан набор переменных, чтобы отразить тот факт, что вопрос опроса был задан в определенном месяце.
Я хочу создать новый набор переменных с...
521 просмотров
schedule
16.11.2023