Хотелось бы получить график, сочетающий в себе плотность наблюдений и cdf.
Обычная проблема с этим состоит в том, что масштабы этих двух очень сильно различаются. Как это можно исправить, то есть использовать две шкалы или, в качестве альтернативы, масштабировать одну из серий данных (желательно в пределах ggplot, поскольку я хотел бы разделить вычисление и отображение данных).
Вот пока что код:
>dput(tmp)
урожайность
structure(list(drivenkm = c(8, 11, 21, 4, 594, 179, 19, 7, 10,
36)), .Names = "drivenkm", class = c("data.table", "data.frame"
), row.names = c(NA, -10L), .internal.selfref = <pointer: 0x223cb78>)
тогда я делаю
p = ggplot(data = tmp, aes(x = drivenkm)) + geom_histogram(aes(y = ..density..), alpha = 0.2, binwidth = 3) + stat_ecdf(aes(x = drivenkm));
print(p)
Я получаю следующее:
Очевидно, что чаша весов далека. Как это можно исправить, чтобы как гистограмму, так и cdf можно было разумно интерпретировать?
Спасибо!