Вопросы по теме 'tapply'

Как совместить tapply с функцией, которая включает репликацию, выборку и суммирование?
У меня есть файл csv, в котором есть информация об учениках и их весе из разных школ. e.g. School School code Weight Age Height A 1 91 15 1.6 A 1 60 16 2.0 B 2 61 14 1.8 B 2 92 13 1.7 B 2 67 14 1.5 B 2 56 15...
749 просмотров
schedule 22.03.2024

Как использовать tapply() в цикле for и распечатать вывод в R?
Я использую tapply() для применения функции к своим данным. Myrepfun <- function(x,n){ nstudents <- replicate(1000,sum(sample(x, size=n,replace=TRUE))) quantile(nstudents,probs=0.95) } tapply(weight,schoolcode,Myrepfun,n=2) Я...
781 просмотров
schedule 01.01.2023

Стандартные ошибки каждого наблюдения среди сгруппированных данных во фрейме данных
У меня есть кадр данных, в котором я хотел бы рассчитать стандартную ошибку наблюдений, сгруппированных по факторам в трех столбцах. Стандартное отклонение и стандартная ошибка среднего значения групп были рассчитаны следующим образом с...
5483 просмотров
schedule 17.01.2023

tapp с упорядоченным множителем
Когда факторный уровень отсутствует, вы можете использовать таблицу следующим образом: marks <- c(1,5,3,4,5,6) table(ordered(marks,levels=1:6)) который вернет таблицу с уровнем «2», указанным с нулевой частотой. Если бы существовал...
397 просмотров
schedule 11.02.2022

делает ли функция by() растущий список
Создает ли функция by список, который увеличивается по одному элементу за раз? Мне нужно обработать кадр данных с примерно 4 миллионами наблюдений, сгруппированных по столбцу факторов. Ситуация аналогична примеру ниже: > # Make 4M rows of...
176 просмотров
schedule 26.04.2023

Функция R which.max с tapply
Я пытаюсь сделать фрейм данных с максимальным количеством записей с коэффициентом. Мне нужен фрейм данных с 4 строками (по одной для каждого G) с максимальным значением X в этой группе и соответствующим значением Y. Я знаю, что мог бы написать цикл,...
1857 просмотров
schedule 01.12.2023

R-tapply не сохраняет даты в формате
Мне нужно сделать быструю агрегацию по id_client дат: min, max, разница дат в месяцах и количество месяцев. Пример таблицы: tbl<-data.frame(id_cliente=c(1,1,1,1,2,3,3,3), fecha=c('2013-01-01', '2013-06-01','2013-05-01', '2013-04-01',...
660 просмотров
schedule 25.01.2024

Получите сумму каждого n-го столбца для каждого человека и создайте новый фрейм данных в r
Поискав похожие посты, пишу свой вопрос. У меня есть ежемесячные переменные количества осадков за несколько лет для каждого участка. Мне нужно рассчитать среднемесячное количество осадков за несколько лет. Я дал простой фрейм данных следующим...
82 просмотров
schedule 01.08.2022

иметь дело с NA при использовании tapply
Рассмотрим следующий пример: Factor <- c(rep('Male', 10),rep('Female', 10)) Age <- sample(30:80,20) df1 <- data.frame(Factor, Age) with(df1, tapply(Age, Factor, mean)) Последняя команда дает нам средний возраст для обоих полов....
1025 просмотров
schedule 17.09.2022

Пользовательская последняя функция rcpp замедляется с dplyr group_by и суммирует по сравнению с tapply
Я пытаюсь понять, как писать функции суммирования Rcpp, которые будут быстрыми с dplyr. Мотивация для этого - функция, для которой dplyr, похоже, не имеет эквивалента, однако для простоты я собираюсь использовать пример простого взятия последнего...
252 просмотров
schedule 20.07.2022

R - разделить один вектор на два отдельных вектора по условию (случай/контрольный пациент)
Я новичок в R и работаю с ЭЭГ, полученной от спящих пациентов. Теперь у меня есть таблица, похожая на эту: ID C3-M2 C4-M1 Disorder 12 347 325 Control 13 397 346 Bipolar 14 368 363 Control 15 370 379...
431 просмотров
schedule 26.09.2022

Суммирование строк матрицы на основе индекса столбца
Я пытаюсь перейти от матрицы, в которой есть столбцы, которые «принадлежат друг другу», к той, в которой были сформированы суммы строк соответствующих подматриц. т.е. идущий от [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12]...
65 просмотров
schedule 21.03.2024

R : Процентиль 90% с постукиванием
Я пытаюсь применить функцию квантиля к столбцу (y) моих данных (вкладка), учитывая группы (столбец x): z <- with (tab, tapply (y, x, quantile)) tab       x y 1 1 0.11 2 1 0.07 3 0.04 4 2 0.39 5 2 0.12 6 3 0.21 7 3 0.06 8 3 0.00 9 3 0.12 10 3...
992 просмотров
schedule 01.04.2024

Неправильный результат среднего с dplyr
Я новичок в R, и у меня есть большой data.frame (более 300000 obs), который выглядит так: Dados <- data.frame(stringsAsFactors=FALSE, id = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L,...
154 просмотров

Как использовать семейство apply () для определения имен столбцов с максимальными значениями в строках
Я хотел бы добавить в фрейм данных столбец, в котором указаны имена тех столбцов, в которых находится максимальное значение, вычисленное по строкам в фрейме данных. Скажем, у меня есть этот фрейм данных: set.seed(123) df <- data.frame( V1...
47 просмотров
schedule 31.01.2023

Неправильный возврат при использовании tapply в R
Я работаю с функцией tapply в R. Я просто пытаюсь заставить функцию tapply возвращать те же результаты, что и функция sapply (тот, который, как я уверен, верен). ЦЕЛЬ: Я работаю с данными state.x77 и пытаюсь найти уровень грамотности в каждом...
66 просмотров
schedule 02.11.2023

создание кадра данных из 5 случайно выбранных наблюдений
В настоящее время я читаю «Практическую статистику для специалистов по данным» и слежу за R, поскольку они демонстрируют некоторый код. Есть один кусок кода, который я особенно изо всех сил пытаюсь следовать логике, и надеялся, что кто-то может...
48 просмотров
schedule 14.11.2022

R - создание переменной, которая записывает категориальную информацию о другом члене группы
У меня есть набор данных data семей, где каждое домохозяйство идентифицировано переменной id , и каждый человек идентифицирован с помощью id + num (идентификатор семьи + член семьи). Для каждого человека у меня есть разные демографические...
38 просмотров
schedule 17.09.2023

Как заполнить раздел столбца уже существующими значениями, соответствующими другому столбцу в R?
Я работаю над некоторыми данными очистки для некоторых траекторий полета, и «позывной» — это обязательное поле, которое мне нужно заполнить. Раздел CSV, с которым я работаю Данные, с которыми я работаю, содержат почти 300 000 строк, и эта...
27 просмотров
schedule 18.10.2023

Создание столбца фрейма данных R с использованием значений строк и совокупного значения
У меня есть данные об уловах рыбы. Каждая строка содержит название вида, значение улова (cpue) и некоторые другие несвязанные поля идентификации (год, местоположение, глубина и т. д.). Этот код создаст набор данных с правильной структурой: # a...
19 просмотров
schedule 29.08.2022