Я не могу найти набор данных, похожий на мою проблему, поэтому я изменил набор данных Iris (набор данных в R), чтобы он выглядел похожим — он достаточно близок!
data = iris
data$type = gl(5,30,150,labels=c("group1","group2","group3","group4","group5"))
data$ID = gl(30,5,150)
Затем я использовал следующий код
xtabs(Sepal.Length ~ Species + type, aggregate(Sepal.Length ~ Species + type + ID, data, mean))
что приводит к
type
Species group1 group2 group3 group4 group5
setosa 30.16 19.90 0.00 0.00 0.00
versicolor 0.00 12.20 35.88 11.28 0.00
virginica 0.00 0.00 0.00 26.24 39.64
Насколько я понимаю, мой код складывает вместе Sepal.Length для каждого идентификатора, а затем принимает среднее значение этих значений для каждого из видов и типов.
Это правильно?
Если нет, то как мне это получить?
Кроме того, как мне получить это, если мои данные таковы, что каждый идентификатор имеет несколько типов? (не могу понять, как построить это в R)
На самом деле, просто чтобы быть совершенно ясным
Что мне нужно, так это код, который суммирует Sepal.Length для каждого идентификатора И типа, затем он возьмет среднее значение этих сумм по всем идентификаторам и опубликует среднее значение Sepal.Length по типу и виду /