Возвращаясь к этой теме , я вычислял пересечение между двумя эллипсами, например. объем пересечения лишай и девственница: , используя следующий mwe:
data(iris)
log.ir <- log(iris[, 1:4])
ir.species <- iris[, 5]
ir.pca <- prcomp(log.ir, center = TRUE, scale. = TRUE)
library(ggbiplot)
g <- ggbiplot(ir.pca, obs.scale = 1, var.scale = 1,
groups = ir.species, ellipse = TRUE,
circle = TRUE)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal',
legend.position = 'top')
print(g)
Затем я вычисляю эллипсоиды с помощью перекрытия {siar} следующим образом:
library(siar)
setosa <- ir.pca$x[ir.species=="setosa",]
versicolor <- ir.pca$x[ir.species=="versicolor",]
virginica <- ir.pca$x[ir.species=="virginica",]
tmp <- overlap(versicolor[,1], versicolor[,2], virginica[,1], virginica[,2], steps = 5)
virginica.percentage <- round(x=(tmp$overlap/tmp$area2*100), digits = 2)
versicolor.percentage <- round(x=(tmp$overlap/tmp$area1*100), digits = 2)
> virginica.percentage [1] 1.54
> versicolor.percentage[1] 1.56
что, по-видимому, намного меньше, чем показано на рисунке 2 выше.
Как видно из кода ggbiplot в строке 50, ggbiplot вычисляет нормальные эллипсоиды вероятности с вероятностью «ellipse.prob = 0,68» по умолчанию, что используется на графике выше.
Из-за перекрытия документации {siar} вычисляет эллипсы как «стандартные эллипсы с поправкой на небольшой размер выборки».
Поэтому я спрашивал себя, как можно изменить перекрытие {siar} для расчета нормального эллипсоида вероятности, подобного тому, который построен/вычислен в ggbiplot.