Адаптивная скользящая средняя - максимальная производительность в R

Я ищу некоторого прироста производительности с точки зрения функций скользящего / скользящего окна в R. Это довольно распространенная задача, которую можно использовать в любом упорядоченном наборе данных наблюдений. Я хотел бы поделиться некоторыми своими выводами, возможно, кто-нибудь сможет предоставить обратную связь, чтобы сделать это еще быстрее.
Важное примечание: я сосредоточен на случае align="right" и адаптивном скользящем окне, поэтому width - вектор (такой же длины как наш вектор наблюдения). В случае, если у нас есть width в качестве скаляра, в пакетах zoo и TTR уже есть очень хорошо разработанные функции, которые было бы очень трудно превзойти (4 года спустя: это было проще, чем я ожидал), поскольку некоторые из них даже используют Fortran (но все же определяемые пользователем FUN могут быть быстрее, используя упомянутый ниже wapply). Пакет
RcppRoll заслуживает упоминания из-за его высокой производительности, но пока нет функции, которая отвечает на этот вопрос. Было бы здорово, если бы кто-нибудь мог расширить его, чтобы ответить на вопрос.

Считайте, что у нас есть следующие данные:

x = c(120,105,118,140,142,141,135,152,154,138,125,132,131,120)
plot(x, type="l")

график фрагмента make_x

И мы хотим применить функцию прокрутки к вектору x с переменным скользящим окном width.

set.seed(1)
width = sample(2:4,length(x),TRUE)

В этом конкретном случае у нас будет функция прокрутки, адаптивная к sample из c(2,3,4).
Мы применим mean функцию, ожидаемые результаты:

r = f(x, width, FUN = mean)
print(r)
##  [1]       NA       NA 114.3333 120.7500 141.0000 135.2500 139.5000
##  [8] 142.6667 147.0000 146.0000 131.5000 128.5000 131.5000 127.6667
plot(x, type="l")
lines(r, col="red")

график фрагмента make_results

Любой индикатор может быть использован для получения width аргумента в виде различных вариантов адаптивных скользящих средних или любой другой функции.

Ищу максимальную производительность.

jangorecki 26.01.2014 источник

Ответы (3)

arrow_upward
24
arrow_downward

Обновление за декабрь 2018 г.

Недавно в data.table была реализована эффективная реализация адаптивных функций прокрутки - подробнее см. ? froll руководство. Кроме того, было определено эффективное альтернативное решение с использованием базы R (fastama ниже). К сожалению, ответ Кевина Уши не затрагивает этот вопрос, поэтому он не включен в тест. Масштаб теста увеличен, так как микросекунды сравнивать бессмысленно.

set.seed(108)
x = rnorm(1e6)
width = rep(seq(from = 100, to = 500, by = 5), length.out=length(x))
microbenchmark(
  zoo=rollapplyr(x, width = width, FUN=mean, fill=NA),
  mapply=base_mapply(x, width=width, FUN=mean, na.rm=T),
  wmapply=wmapply(x, width=width, FUN=mean, na.rm=T),
  ama=ama(x, width, na.rm=T),
  fastama=fastama(x, width),
  frollmean=frollmean(x, width, na.rm=T, adaptive=TRUE),
  frollmean_exact=frollmean(x, width, na.rm=T, adaptive=TRUE, algo="exact"),
  times=1L
)
#Unit: milliseconds
#            expr          min           lq         mean       median           uq          max neval
#             zoo 32371.938248 32371.938248 32371.938248 32371.938248 32371.938248 32371.938248     1
#          mapply 13351.726032 13351.726032 13351.726032 13351.726032 13351.726032 13351.726032     1
#         wmapply 15114.774972 15114.774972 15114.774972 15114.774972 15114.774972 15114.774972     1
#             ama  9780.239091  9780.239091  9780.239091  9780.239091  9780.239091  9780.239091     1
#         fastama   351.618042   351.618042   351.618042   351.618042   351.618042   351.618042     1
#       frollmean     7.708054     7.708054     7.708054     7.708054     7.708054     7.708054     1
# frollmean_exact   194.115012   194.115012   194.115012   194.115012   194.115012   194.115012     1

ama = function(x, n, na.rm=FALSE, fill=NA, nf.rm=FALSE) {
  # more or less the same as previous forloopply
  stopifnot((nx<-length(x))==length(n))
  if (nf.rm) x[!is.finite(x)] = NA_real_
  ans = rep(NA_real_, nx)
  for (i in seq_along(x)) {
    ans[i] = if (i >= n[i])
      mean(x[(i-n[i]+1):i], na.rm=na.rm)
    else as.double(fill)
  }
  ans
}
fastama = function(x, n, na.rm, fill=NA) {
  if (!missing(na.rm)) stop("fast adaptive moving average implemented in R does not handle NAs, input having NAs will result in incorrect answer so not even try to compare to it")
  # fast implementation of adaptive moving average in R, in case of NAs incorrect answer
  stopifnot((nx<-length(x))==length(n))
  cs = cumsum(x)
  ans = rep(NA_real_, nx)
  for (i in seq_along(cs)) {
    ans[i] = if (i == n[i])
      cs[i]/n[i]
    else if (i > n[i])
      (cs[i]-cs[i-n[i]])/n[i]
    else as.double(fill)
  }
  ans
}

Старый ответ:

Я выбрал 4 доступных решения, которые не нужны для C ++, их довольно легко найти или погуглить.

# 1. rollapply
library(zoo)
?rollapplyr
# 2. mapply
base_mapply <- function(x, width, FUN, ...){
  FUN <- match.fun(FUN)
  f <- function(i, width, data){
    if(i < width) return(NA_real_)
    return(FUN(data[(i-(width-1)):i], ...))
  }
  mapply(FUN = f, 
         seq_along(x), width,
         MoreArgs = list(data = x))
}
# 3. wmapply - modified version of wapply found: https://rmazing.wordpress.com/2013/04/23/wapply-a-faster-but-less-functional-rollapply-for-vector-setups/
wmapply <- function(x, width, FUN = NULL, ...){
  FUN <- match.fun(FUN)
  SEQ1 <- 1:length(x)
  SEQ1[SEQ1 <  width] <- NA_integer_
  SEQ2 <- lapply(SEQ1, function(i) if(!is.na(i)) (i - (width[i]-1)):i)
  OUT <- lapply(SEQ2, function(i) if(!is.null(i)) FUN(x[i], ...) else NA_real_)
  return(base:::simplify2array(OUT, higher = TRUE))
}
# 4. forloopply - simple loop solution
forloopply <- function(x, width, FUN = NULL, ...){
  FUN <- match.fun(FUN)
  OUT <- numeric()
  for(i in 1:length(x)) {
    if(i < width[i]) next
    OUT[i] <- FUN(x[(i-(width[i]-1)):i], ...)
  }
  return(OUT)
}

Ниже приведены сроки для функции prod. mean функция может быть уже оптимизирована внутри rollapplyr. Все результаты равны.

library(microbenchmark)
# 1a. length(x) = 1000, window = 5-20
x <- runif(1000,0.5,1.5)
width <- rep(seq(from = 5, to = 20, by = 5), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr       min        lq    median       uq       max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 59.690217 60.694364 61.979876 68.55698 153.60445   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 14.372537 14.694266 14.953234 16.00777  99.82199   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T)  9.384938  9.755893  9.872079 10.09932  84.82886   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 14.730428 15.062188 15.305059 15.76560 342.44173   100

# 1b. length(x) = 1000, window = 50-200
x <- runif(1000,0.5,1.5)
width <- rep(seq(from = 50, to = 200, by = 50), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr      min       lq   median       uq      max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 71.99894 74.19434 75.44112 86.44893 281.6237   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 15.67158 16.10320 16.39249 17.20346 103.6211   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T) 10.88882 11.54721 11.75229 12.19790 106.1170   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 15.70704 16.06983 16.40393 17.14210 108.5005   100

# 2a. length(x) = 10000, window = 5-20
x <- runif(10000,0.5,1.5)
width <- rep(seq(from = 5, to = 20, by = 5), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr       min       lq   median       uq       max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 753.87882 781.8789 809.7680 872.8405 1116.7021   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 148.54919 159.9986 231.5387 239.9183  339.7270   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T)  98.42682 105.2641 117.4923 183.4472  245.4577   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 533.95641 602.0652 646.7420 672.7483  922.3317   100

# 2b. length(x) = 10000, window = 50-200
x <- runif(10000,0.5,1.5)
width <- rep(seq(from = 50, to = 200, by = 50), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr      min       lq    median        uq       max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 912.5829 946.2971 1024.7245 1071.5599 1431.5289   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 171.3189 180.6014  260.8817  269.5672  344.4500   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T) 123.1964 131.1663  204.6064  221.1004  484.3636   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 561.2993 696.5583  800.9197  959.6298 1273.5350   100

jangorecki 26.01.2014

comment

@Dirk, я не хочу заводить блог только из-за одной акции. SO - тоже очень хорошая доска для обсуждения. Вопрос о вращающемся окне FUN довольно часто встречается на SO, но я не нашел хороших тестов. Тем не менее, я надеюсь, что можно добиться улучшения производительности в этой области без перехода на Cpp, поэтому я с нетерпением жду лучших ответов на свой вопрос. - jangorecki; 27.01.2014

comment

Не согласен, ничего плохого в этом не вижу. SO - это хранилище знаний. Я, например, кое-что извлек из этого. - BrodieG; 27.01.2014

comment

@DirkEddelbuettel, SO действительно поощряет пользователей задавать свои вопросы и отвечать на них, если это делается с соблюдением надлежащего этикета. См. здесь. - Kevin Ushey; 27.01.2014

comment

Извините, здесь нет терпения на мета-пупок. SO раньше был отличным ресурсом. Теперь он наводнен людьми, которые не могут / не хотят проводить исследования самостоятельно, повторяют вопросы и другие злоупотребления платформой. И использование ее в качестве персональной CMS до сих пор мне не нравится. - Dirk Eddelbuettel; 27.01.2014

comment

@DirkEddelbuettel, согласитесь с большой ленью, но вы должны признать, что проблема вовсе не в этом. Очевидно, MusX потратил немало времени, собирая вместе свои вопросы и ответы. Я читал много стандартного R, освещенного там, и проблемы, которые он описывает, обычно не документируются. Есть гораздо худшее поведение, за которое можно отрицать / кричать. - BrodieG; 27.01.2014

comment

Позвольте мне сказать по-другому, если бы кто-то другой задал вопрос, и MusX ответил бы на него, его ответ был бы воспринят как положительный вклад. И это тоже не бесполезный вопрос, так что я действительно не понимаю, насколько это плохо. - BrodieG; 27.01.2014

comment

Есть одно хорошее (на основе C ++) решение проблемы - предоставлено Кевином в виде пакета CRAN. OP не мог тестировать без предоставления каких-либо подробностей и продолжал тратить время на множество нескомпилированных решений. И это вклад? - Dirk Eddelbuettel; 27.01.2014

comment

согласно информации от Кевина RcppRoll обрабатывает width только как скаляр, поэтому по умолчанию это не решит проблему. Я не знаю Cpp, но полагаю, что, возможно, я внесу изменения, чтобы справиться с этим, так же, как я сделал для отправки сообщений от r-bloggers, которые также принимают только скалярные width. Большинство задач можно выполнить с помощью интерфейса R-cpp. Без width в качестве скаляра трудно сравнивать тайминги, даже тогда хорошо сравнивать лучшее решение без cpp с таймингами решения cpp. - jangorecki; 27.01.2014

arrow_upward
23
arrow_downward

Для справки, вам обязательно стоит проверить RcppRoll, если у вас есть только одно окно, которое нужно "перевернуть":

library(RcppRoll) ## install.packages("RcppRoll")
library(microbenchmark)
x <- runif(1E5)
all.equal( rollapplyr(x, 10, FUN=prod), roll_prod(x, 10) )
microbenchmark( times=5,
  rollapplyr(x, 10, FUN=prod),
  roll_prod(x, 10)
)

дает мне

> library(RcppRoll)
> library(microbenchmark)
> x <- runif(1E5)
> all.equal( rollapplyr(x, 10, FUN=prod), roll_prod(x, 10) )
[1] TRUE
> microbenchmark( times=5,
+   zoo=rollapplyr(x, 10, FUN=prod),
+   RcppRoll=roll_prod(x, 10)
+ )
Unit: milliseconds
     expr        min         lq     median         uq         max neval
      zoo 924.894069 968.467299 997.134932 1029.10883 1079.613569     5
 RcppRoll   1.509155   1.553062   1.760739    1.90061    1.944999     5

Это немного быстрее;) и пакет достаточно гибок, чтобы пользователи могли определять и использовать свои собственные скользящие функции (с C ++). В будущем я могу расширить пакет, чтобы разрешить несколько окон ширины, но я уверен, что это будет сложно сделать правильно.

Если вы хотите определить prod самостоятельно, вы можете это сделать - RcppRoll позволяет вам определять свои собственные функции C ++ для передачи и генерировать функцию «прокрутки», если хотите. rollit дает несколько более приятный интерфейс, а rollit_raw просто позволяет вам написать функцию на C ++ самостоятельно, что-то вроде того, что вы могли бы сделать с Rcpp::cppFunction. Философия заключается в том, что вам нужно только выразить вычисление, которое вы хотите выполнить в конкретном окне, а RcppRoll может позаботиться об итерациях по окнам некоторого размера.

library(RcppRoll)
library(microbenchmark)
x <- runif(1E5)
my_rolling_prod <- rollit(combine="*")
my_rolling_prod2 <- rollit_raw("
double output = 1;
for (int i=0; i < n; ++i) {
  output *= X(i);
}
return output;
")
all.equal( roll_prod(x, 10), my_rolling_prod(x, 10) )
all.equal( roll_prod(x, 10), my_rolling_prod2(x, 10) )
microbenchmark( times=5,
  rollapplyr(x, 10, FUN=prod),
  roll_prod(x, 10),
  my_rolling_prod(x, 10),
  my_rolling_prod2(x, 10)
)

дает мне

> library(RcppRoll)
> library(microbenchmark)
> # 1a. length(x) = 1000, window = 5-20
> x <- runif(1E5)
> my_rolling_prod <- rollit(combine="*")
C++ source file written to /var/folders/m7/_xnnz_b53kjgggkb1drc1f8c0000gn/T//RtmpcFMJEV/file80263aa7cca2.cpp .
Compiling...
Done!
> my_rolling_prod2 <- rollit_raw("
+ double output = 1;
+ for (int i=0; i < n; ++i) {
+   output *= X(i);
+ }
+ return output;
+ ")
C++ source file written to /var/folders/m7/_xnnz_b53kjgggkb1drc1f8c0000gn/T//RtmpcFMJEV/file802673777da2.cpp .
Compiling...
Done!
> all.equal( roll_prod(x, 10), my_rolling_prod(x, 10) )
[1] TRUE
> all.equal( roll_prod(x, 10), my_rolling_prod2(x, 10) )
[1] TRUE
> microbenchmark(
+   rollapplyr(x, 10, FUN=prod),
+   roll_prod(x, 10),
+   my_rolling_prod(x, 10),
+   my_rolling_prod2(x, 10)
+ )

> microbenchmark( times=5,
+   rollapplyr(x, 10, FUN=prod),
+   roll_prod(x, 10),
+   my_rolling_prod(x, 10),
+   my_rolling_prod2(x, 10)
+ )
Unit: microseconds
                          expr        min          lq      median          uq         max neval
 rollapplyr(x, 10, FUN = prod) 979710.368 1115931.323 1117375.922 1120085.250 1149117.854     5
              roll_prod(x, 10)   1504.377    1635.749    1638.943    1815.344    2053.997     5
        my_rolling_prod(x, 10)   1507.687    1572.046    1648.031    2103.355    7192.493     5
       my_rolling_prod2(x, 10)    774.381     786.750     884.951    1052.508    1434.660     5

Итак, на самом деле, если вы способны выразить вычисление, которое хотите выполнить в конкретном окне, либо через интерфейс rollit, либо с помощью функции C ++, переданной через rollit_raw (чей интерфейс немного жесткий, но все же функциональный), вы находитесь в хорошая фигура.

Kevin Ushey 27.01.2014

comment

Я не знаю вашего roll_prod, но я искал не оптимизированные функции, я выбираю prod для имитации пользовательской функции только потому, что другие стандартные _2 _, _ 3_ и т. Д. уже были оптимизированы в rollapply. Действительно, у вашей функции есть выдающееся время, но все же width в качестве скаляра здесь не проблема. В любом случае для меня самая большая проблема здесь - это Cpp. Спасибо за тайминги, могу ли я попросить те же самые тайминги с помощью roll_it? Чтобы иметь тайминги для стандартной определяемой пользователем prod функции. - jangorecki; 27.01.2014

comment

Я обновил свой ответ примером того, как вы можете использовать определяемую пользователем функцию с RcppRoll; в частности, два способа выражения prod здесь. - Kevin Ushey; 27.01.2014

comment

Потрясающий! Думаю, это помогло мне решить и связанный с этим вопрос! Спасибо! - bright-star; 08.05.2014

comment

Решает ли обновление вопрос об адаптивном катании? Я не вижу векторизованных атрибутов. - jangorecki; 08.01.2015

arrow_upward
6
arrow_downward

Как-то люди пропустили сверхбыстрый runmed() в базе R (пакет статистики). Насколько я понимаю исходный вопрос, это не адаптивно, но для скользящей медианы это БЫСТРО! Сравнивая здесь с roll_median() от RcppRoll.

> microbenchmark(
+   runmed(x = x, k = 3),
+   roll_median(x, 3),
+   times=1000L
+ )
Unit: microseconds
                 expr     min      lq      mean  median      uq     max neval
 runmed(x = x, k = 3)  41.053  44.854  47.60973  46.755  49.795 117.838  1000
    roll_median(x, 3) 101.872 105.293 108.72840 107.574 111.375 178.657  1000

LauriK 28.01.2015

comment

он должен быть адаптивным, чтобы ответить на вопрос :) - jangorecki; 28.01.2015

Адаптивная скользящая средняя - максимальная производительность в R

Ответы (3)

Похожие вопросы