Вопросы по теме 'tapply'
Как совместить tapply с функцией, которая включает репликацию, выборку и суммирование?
У меня есть файл csv, в котором есть информация об учениках и их весе из разных школ.
e.g.
School School code Weight Age Height
A 1 91 15 1.6
A 1 60 16 2.0
B 2 61 14 1.8
B 2 92 13 1.7
B 2 67 14 1.5
B 2 56 15...
749 просмотров
schedule
22.03.2024
Как использовать tapply() в цикле for и распечатать вывод в R?
Я использую tapply() для применения функции к своим данным.
Myrepfun <- function(x,n){
nstudents <- replicate(1000,sum(sample(x, size=n,replace=TRUE)))
quantile(nstudents,probs=0.95)
}
tapply(weight,schoolcode,Myrepfun,n=2)
Я...
781 просмотров
schedule
01.01.2023
Стандартные ошибки каждого наблюдения среди сгруппированных данных во фрейме данных
У меня есть кадр данных, в котором я хотел бы рассчитать стандартную ошибку наблюдений, сгруппированных по факторам в трех столбцах. Стандартное отклонение и стандартная ошибка среднего значения групп были рассчитаны следующим образом с...
5483 просмотров
schedule
17.01.2023
tapp с упорядоченным множителем
Когда факторный уровень отсутствует, вы можете использовать таблицу следующим образом:
marks <- c(1,5,3,4,5,6)
table(ordered(marks,levels=1:6))
который вернет таблицу с уровнем «2», указанным с нулевой частотой.
Если бы существовал...
397 просмотров
schedule
11.02.2022
делает ли функция by() растущий список
Создает ли функция by список, который увеличивается по одному элементу за раз?
Мне нужно обработать кадр данных с примерно 4 миллионами наблюдений, сгруппированных по столбцу факторов. Ситуация аналогична примеру ниже:
> # Make 4M rows of...
176 просмотров
schedule
26.04.2023
Функция R which.max с tapply
Я пытаюсь сделать фрейм данных с максимальным количеством записей с коэффициентом. Мне нужен фрейм данных с 4 строками (по одной для каждого G) с максимальным значением X в этой группе и соответствующим значением Y. Я знаю, что мог бы написать цикл,...
1857 просмотров
schedule
01.12.2023
R-tapply не сохраняет даты в формате
Мне нужно сделать быструю агрегацию по id_client дат: min, max, разница дат в месяцах и количество месяцев.
Пример таблицы:
tbl<-data.frame(id_cliente=c(1,1,1,1,2,3,3,3),
fecha=c('2013-01-01', '2013-06-01','2013-05-01', '2013-04-01',...
660 просмотров
schedule
25.01.2024
Получите сумму каждого n-го столбца для каждого человека и создайте новый фрейм данных в r
Поискав похожие посты, пишу свой вопрос. У меня есть ежемесячные переменные количества осадков за несколько лет для каждого участка. Мне нужно рассчитать среднемесячное количество осадков за несколько лет. Я дал простой фрейм данных следующим...
82 просмотров
schedule
01.08.2022
иметь дело с NA при использовании tapply
Рассмотрим следующий пример:
Factor <- c(rep('Male', 10),rep('Female', 10))
Age <- sample(30:80,20)
df1 <- data.frame(Factor, Age)
with(df1, tapply(Age, Factor, mean))
Последняя команда дает нам средний возраст для обоих полов....
1025 просмотров
schedule
17.09.2022
Пользовательская последняя функция rcpp замедляется с dplyr group_by и суммирует по сравнению с tapply
Я пытаюсь понять, как писать функции суммирования Rcpp, которые будут быстрыми с dplyr. Мотивация для этого - функция, для которой dplyr, похоже, не имеет эквивалента, однако для простоты я собираюсь использовать пример простого взятия последнего...
252 просмотров
schedule
20.07.2022
R - разделить один вектор на два отдельных вектора по условию (случай/контрольный пациент)
Я новичок в R и работаю с ЭЭГ, полученной от спящих пациентов. Теперь у меня есть таблица, похожая на эту:
ID C3-M2 C4-M1 Disorder
12 347 325 Control
13 397 346 Bipolar
14 368 363 Control
15 370 379...
431 просмотров
schedule
26.09.2022
Суммирование строк матрицы на основе индекса столбца
Я пытаюсь перейти от матрицы, в которой есть столбцы, которые «принадлежат друг другу», к той, в которой были сформированы суммы строк соответствующих подматриц. т.е. идущий от
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12]...
65 просмотров
schedule
21.03.2024
R : Процентиль 90% с постукиванием
Я пытаюсь применить функцию квантиля к столбцу (y) моих данных (вкладка), учитывая группы (столбец x):
z <- with (tab, tapply (y, x, quantile))
tab
x y
1 1 0.11
2 1 0.07
3 0.04
4 2 0.39
5 2 0.12
6 3 0.21
7 3 0.06
8 3 0.00
9 3 0.12
10 3...
992 просмотров
schedule
01.04.2024
Неправильный результат среднего с dplyr
Я новичок в R, и у меня есть большой data.frame (более 300000 obs), который выглядит так:
Dados <- data.frame(stringsAsFactors=FALSE,
id = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L,
14L, 15L,...
154 просмотров
schedule
09.02.2024
Как использовать семейство apply () для определения имен столбцов с максимальными значениями в строках
Я хотел бы добавить в фрейм данных столбец, в котором указаны имена тех столбцов, в которых находится максимальное значение, вычисленное по строкам в фрейме данных.
Скажем, у меня есть этот фрейм данных:
set.seed(123)
df <- data.frame(
V1...
47 просмотров
schedule
31.01.2023
Неправильный возврат при использовании tapply в R
Я работаю с функцией tapply в R. Я просто пытаюсь заставить функцию tapply возвращать те же результаты, что и функция sapply (тот, который, как я уверен, верен).
ЦЕЛЬ:
Я работаю с данными state.x77 и пытаюсь найти уровень грамотности в каждом...
66 просмотров
schedule
02.11.2023
создание кадра данных из 5 случайно выбранных наблюдений
В настоящее время я читаю «Практическую статистику для специалистов по данным» и слежу за R, поскольку они демонстрируют некоторый код. Есть один кусок кода, который я особенно изо всех сил пытаюсь следовать логике, и надеялся, что кто-то может...
48 просмотров
schedule
14.11.2022
R - создание переменной, которая записывает категориальную информацию о другом члене группы
У меня есть набор данных data семей, где каждое домохозяйство идентифицировано переменной id , и каждый человек идентифицирован с помощью id + num (идентификатор семьи + член семьи). Для каждого человека у меня есть разные демографические...
38 просмотров
schedule
17.09.2023
Как заполнить раздел столбца уже существующими значениями, соответствующими другому столбцу в R?
Я работаю над некоторыми данными очистки для некоторых траекторий полета, и «позывной» — это обязательное поле, которое мне нужно заполнить.
Раздел CSV, с которым я работаю
Данные, с которыми я работаю, содержат почти 300 000 строк, и эта...
27 просмотров
schedule
18.10.2023
Создание столбца фрейма данных R с использованием значений строк и совокупного значения
У меня есть данные об уловах рыбы. Каждая строка содержит название вида, значение улова (cpue) и некоторые другие несвязанные поля идентификации (год, местоположение, глубина и т. д.). Этот код создаст набор данных с правильной структурой:
# a...
19 просмотров
schedule
29.08.2022