Вопросы по теме 'plyr'

R: групповое ускорение по операциям
У меня есть симуляция, которая имеет огромный агрегат и комбинирует шаг прямо посередине. Я прототипировал этот процесс, используя функцию plyr ddply (), которая отлично подходит для огромного процента моих потребностей. Но мне нужно, чтобы этот...
9562 просмотров
schedule 23.01.2024

plyrsummary вызывает только глобальные функции
Я пытаюсь передать функцию (weight.func) другой функции (оболочке), которая вызывает ddply. Я хочу, чтобы ddply использовал эту функцию (weight.func) как часть своих вычислений. Я получаю результат, который хочу, когда weight.func установлен...
373 просмотров
schedule 21.05.2022

Извлечение RMSE из объекта lmList
У меня есть следующий код для извлечения коэффициентов из объекта lmList. library(lme4) library(plyr) lm.model <- lmList(Y ~ X | eventID, df) param <- ldply(lm.model, coef) Этот код работает нормально. Однако является ли это...
1656 просмотров
schedule 03.12.2022

Как переписать команду sapply для повышения производительности?
У меня есть data.frame с именем «d» из ~ 1 300 000 строк и 4 столбца и еще один data.frame с именем «gc» из ~ 12 000 строк и 2 столбца (но см. меньший пример ниже). d <- data.frame( gene=rep(c("a","b","c"),4), val=rnorm(12), ind=c(...
503 просмотров
schedule 10.10.2022

ddply возвращает слишком много результатов
По какой-то причине я получаю больше результатов, чем ожидал, после обновления до R-2.13.0 - и обновления до plyr_1.5.1.tar.gz... Я попробовал это на старой версии plyr (версия неизвестна, к сожалению, поскольку Я просто перезаписал...)...
233 просмотров
schedule 04.05.2024

Среднее значение элементов в списке data.frames
Предположим, у меня есть список data.frames (равных строк и столбцов) dat1 <- as.data.frame(matrix(rnorm(25), ncol=5)) dat2 <- as.data.frame(matrix(rnorm(25), ncol=5)) dat3 <- as.data.frame(matrix(rnorm(25), ncol=5)) all.dat <-...
19456 просмотров
schedule 03.06.2023

Группировка переменных R на основе подгрупп
У меня есть данные в формате PERSON_A PERSON_B MEET LEAVE В основном это описывает, когда ЛИЦО_А встретил ЛИЦО_Б во время ВСТРЕЧИ, и они сказали друг другу «до свидания» в момент ВЫЙТИ. Время выражено в секундах, и небольшая часть данных...
213 просмотров
schedule 12.11.2023

Суммирование строк на основе определенных комбинаций факторов
Вероятно, это глупый вопрос, но я прочитал главу Кроули о фреймах данных и прошерстил Интернет, но пока ничего не смог заставить работать. Вот пример набора данных, похожий на мой: > data<-data.frame(site=c("A","A","A","A","B","B"),...
14728 просмотров
schedule 23.06.2023

Как ограничить время ожидания, если элемент списка не работает или занимает слишком много времени?
Для нескольких усилий, в которых я сейчас участвую, я запускаю большие наборы данных с многочисленными комбинациями параметров с помощью ряда функций. У функций есть оболочка (так что я могу mclapply ) для простоты работы в кластере. Однако я...
435 просмотров
schedule 18.06.2023

Извлеките индексы верхних n-х значений для каждого элемента в кадре данных
У меня есть временная отметка о 4 студентах, отвечающих на онлайн-анкету в кадре данных. 1-й столбец — это время, 2-й — идентификатор студента (id: 1,2,3,4). Ниже приведен смоделированный кадр данных: DF <- data.frame(cbind(Time=1:60,...
951 просмотров
schedule 06.09.2023

Самый простой способ вычитания, связанного с одним уровнем фактора, из значений, связанных со всеми другими уровнями фактора.
У меня есть фрейм данных, содержащий ставки на «живое» лечение и ставки на «убитое» лечение. Я хотел бы вычесть убитые обработки из живых: df <- data.frame(id1=gl(2, 3, labels=c("a", "b")), id2=rep(gl(3, 1, labels=c("live1",...
3121 просмотров
schedule 06.12.2022

Почему в dlply (в пакете R plyr) нет индикатора выполнения
Я использую пакет plyr для обработки списков и фреймов данных. Я заметил следующее поведение: Пример 1 - list_2 <- llply(list_1, function_1, .progress='text') это работает так, как ожидалось. Он генерирует список_2 из списка_1 с...
1014 просмотров
schedule 11.02.2023

Использование dlply с pROC
Я пытаюсь применить функцию roc() из пакета pROC к определенным переменным из фрейма данных df , подмножества на df$site , состоящего из символов, которые выглядят как «01», «02», «03». Функция roc() возвращает список, поэтому я ожидаю, что мой...
110 просмотров
schedule 01.07.2023

R: Общее сведение JSON к data.frame
Этот вопрос касается общего механизма преобразования любого набора нециклических однородных или разнородных структур данных в кадр данных. Это может быть особенно полезно при работе с большим количеством документов JSON или с большим документом JSON,...
10570 просмотров
schedule 25.03.2023

Измените фрейм данных с несколькими элементами в каждой позиции в фрейме данных
Фактически это продолжение предыдущего вопроса: Сплайн по нескольким факторам во фрейме данных так что извиняюсь за повторное прохождение первой части. И поверьте, я пытался решить сам! Итак, некоторые образцы данных: mydf<-...
102 просмотров
schedule 05.10.2022

функция запуска в каждой строке, которая возвращает несколько строк R
После долгих экспериментов и поиска в Google ... и повторных экспериментов, я наконец-то задаю свой первый вопрос о StackOverflow :) У меня есть data.frame, и я хочу применить пользовательскую функцию expandBases к каждой строке data.frame....
1414 просмотров
schedule 05.06.2023

Как преобразовать вложенный список
У меня есть вложенный список и мне нужно вычислить корреляцию frt и srt $`bs. bs` fapp frt sapp srt 1 bs 2280 bs 0.25 2 bs 2287 bs 0.25 3 bs 2288 bs 0.25 4 bs 2289 bs 0.25 $`bs. lhc` fapp frt sapp srt 5 bs...
1174 просмотров
schedule 03.12.2022

which.min в dcast () reshape2?
Я хотел бы извлечь значение var2, которое соответствует минимальному значению var1 в каждой комбинации строительного месяца. Вот мой (поддельный) набор данных: head(mydata) # building month var1 var2 #1 A 1 -26.96333...
223 просмотров
schedule 18.07.2023

Вызов различных элементов списка в plyr
У меня есть код, который выглядит так reps=128 results = llply(1:reps, function(idx){out<-single.imputation(start.data)},.parallel=TRUE) start.data — это список со значениями от 1 до 128. Как мне это закодировать, чтобы каждый...
64 просмотров
schedule 23.05.2022

Выполнение операций над подмножеством с использованием таблицы данных
У меня есть набор данных опроса в широкой форме. Для конкретного вопроса в необработанных данных был создан набор переменных, чтобы отразить тот факт, что вопрос опроса был задан в определенном месяце. Я хочу создать новый набор переменных с...
521 просмотров
schedule 16.11.2023