Я разрабатываю пакет R, который требует, чтобы я сообщал процентные ранги для каждого из возвращаемых значений. Однако дистрибутив у меня огромен (~ 10 миллионов значений).
В настоящее время я делаю это путем создания функции ecdf
, сохранения этой функции в файл и чтения ее в пакете при необходимости. Это проблематично, потому что файл, который я сохраняю, оказывается огромным (~ 120 МБ) и загружается слишком долго:
f = ecdf(rnorm(10000000))
save(f, file='tmp.Rsav')
Есть ли способ сделать это более эффективным, возможно, каким-то образом приблизив процентильный ранг в R?
Спасибо