Я пытался найти ответ на другие вопросы, но либо из-за того, что другие вопросы были очень конкретными, либо сформулированы запутанно, я не смог найти точную информацию, применимую к моей ситуации. Вот оно:
У меня есть, скажем, две переменные и по 100 наблюдений за каждой:
V1 <- rnorm(100, 0, 1)
V2 <- rpois(100, 4)
data <- cbind(V1, V2)
Я хочу сгруппировать участников на основе того, в какой квантили они попадают по одной переменной, скажем, V1, а затем вычислить среднее значение и стандартное отклонение V2 для каждой квантильной группы.
Ключевое примечание: я хочу создать группы на основе того, сколько стандартных отклонений они составляют от среднего значения V1. Таким образом, мои квантильные группы должны быть примерно такими: нижние 2%, 2-я p-плитка до 16-й, 16-я до 50-й, 50-я до 84-й, 84-й до 98-й и верхние 2%.
quantile
к частиbreaks
cut
, чтобы создать дополнительный столбец, помечающий данные на основе того, какой квантиль он появляется. Я попробовал следующее, но это неправильно, однако подход может бытьdata %>% mutate( quant = cut(V1, breaks = quantile(V1, prob = c(0.02, 0.16, 0.5, 0.84, 0.98)))
. Этот вопрос касается аналогичного stackoverflow.com/questions/4126326/ - person NColl   schedule 18.12.2018