Я экспериментирую с некоторыми смоделированными распределениями значений p.
При построении моих данных с помощью hist()
результат выглядит так, как ожидалось. Значения p равномерно распределены, и есть пик, близкий к нулю («сигнал»).
data = read_tsv("./data_vector.tsv")
hist(data$p_values, breaks = seq(0, 1, by=1/30))
Однако, если сделать то же самое с ggplot/qplot, пик слева отсутствует:
qplot(data$p_values, geom="histogram", bins=30)
Что я сделал не так? Я ожидал, что эти две команды будут эквивалентны.
Данные и код. Мои входные данные, а также отчет Rmarkdown доступны на этом суть
breaks=
доgeom_histogram()
:ggplot(data, aes(x=p_values)) + geom_histogram(bins=30, breaks = seq(0, 1, by=1/30))
- person MrFlick   schedule 17.05.2017?quantile
.) - person joran   schedule 17.05.2017ggplot2:::bin_breaks_bins(range(data$p_values), 30)
. он не знает min/mad, поэтому он разбивает самый нижний бин, выходящий за пределы диапазона 0/1. Правая сторона корзины находится на уровне 0,03333 для вашего истории и 0,017227 для ggplot. - person MrFlick   schedule 17.05.2017