R Как использовать curly curly с filter или filter_?

Я отвечал на этот вопрос, где комментаторы предложили !! и я подумал, что это может быть хорошим местом для использования curly curly {{, но я не смог заставить его работать (может быть, неприменимо?).

Как я могу выполнить эту операцию фильтрации без использования filter_, eval / parse или quote-unquote? ~ Помогло бы?

Мое решение (1g) использует filter_ и условия, созданные с помощью paste. 1a работает (но может ли он как-то использовать {{}}?)

А что, если бы мы хотели отфильтровать по нескольким переменным? Здесь вы видите, что 2g работает ниже (в то время как 2a больше не работает).

library(tidyverse)
set.seed(1234)
A <- matrix(rnorm(30),nrow = 10, ncol = 3) %>% as_tibble() %>% set_names(paste("var", seq(1:3), sep = ""))
varnames_1 <- c("var2")

(expected_result_1 <- filter(A, var2 > 0))
#> # A tibble: 3 x 3
#>     var1   var2   var3
#>    <dbl>  <dbl>  <dbl>
#> 1 -2.35  0.0645  0.460
#> 2  0.429 0.959  -0.694
#> 3 -0.890 2.42   -0.936

(answer_1a <- filter(A,!!ensym(varnames_1) > 0)) # works (thanks joran and aosmith)
#> # A tibble: 3 x 3
#>     var1   var2   var3
#>    <dbl>  <dbl>  <dbl>
#> 1 -2.35  0.0645  0.460
#> 2  0.429 0.959  -0.694
#> 3 -0.890 2.42   -0.936

(answer_1b <- filter_(A, varnames_1 > 0)) # filter_ not doing what I thought it might
#> Warning: filter_() is deprecated. 
#> Please use filter() instead
#> 
#> The 'programming' vignette or the tidyeval book can help you
#> to program with filter() : https://tidyeval.tidyverse.org
#> This warning is displayed once per session.
#> # A tibble: 10 x 3
#>      var1    var2    var3
#>     <dbl>   <dbl>   <dbl>
#>  1 -1.21  -0.477   0.134 
#>  2  0.277 -0.998  -0.491 
#>  3  1.08  -0.776  -0.441 
#>  4 -2.35   0.0645  0.460 
#>  5  0.429  0.959  -0.694 
#>  6  0.506 -0.110  -1.45  
#>  7 -0.575 -0.511   0.575 
#>  8 -0.547 -0.911  -1.02  
#>  9 -0.564 -0.837  -0.0151
#> 10 -0.890  2.42   -0.936

(answer_1c <- filter(A, {{varnames_1}} > 0)) # curly curly not doing what I thought it might
#> # A tibble: 10 x 3
#>      var1    var2    var3
#>     <dbl>   <dbl>   <dbl>
#>  1 -1.21  -0.477   0.134 
#>  2  0.277 -0.998  -0.491 
#>  3  1.08  -0.776  -0.441 
#>  4 -2.35   0.0645  0.460 
#>  5  0.429  0.959  -0.694 
#>  6  0.506 -0.110  -1.45  
#>  7 -0.575 -0.511   0.575 
#>  8 -0.547 -0.911  -1.02  
#>  9 -0.564 -0.837  -0.0151
#> 10 -0.890  2.42   -0.936
(answer_1d <- filter(A, {{varnames_1 > 0}})) # curly curly not doing what I thought it might
#> `arg` must be a symbol

conditions_1 <- paste(varnames_1, "> 0")
(answer_1e <- filter(A, conditions_1)) # does not work
#> Error: Argument 2 filter condition does not evaluate to a logical vector
(answer_1f <- filter(A, {{conditions_1}})) # curly curly not doing what I thought it might
#> Error: Argument 2 filter condition does not evaluate to a logical vector
(answer_1g <- filter_(A, conditions_1)) # works
#> # A tibble: 3 x 3
#>     var1   var2   var3
#>    <dbl>  <dbl>  <dbl>
#> 1 -2.35  0.0645  0.460
#> 2  0.429 0.959  -0.694
#> 3 -0.890 2.42   -0.936

# what if we wanted to filter multiple variables?

varnames_2 <- c("var2", "var3")
(expected_result_2 <- filter(A, var2 > 0 & var3 > 0))
#> # A tibble: 1 x 3
#>    var1   var2  var3
#>   <dbl>  <dbl> <dbl>
#> 1 -2.35 0.0645 0.460

(answer_2a <- filter(A,!!ensym(varnames_2) > 0)) # does not work
#> Only strings can be converted to symbols

conditions_2 <- paste(paste(varnames_2, "> 0"), collapse = " & ")
(answer_2f <- filter(A, {{conditions_2}})) # curly curly not doing what I thought it might
#> Error: Argument 2 filter condition does not evaluate to a logical vector
(answer_2g <- filter_(A, conditions_2)) # works
#> # A tibble: 1 x 3
#>    var1   var2  var3
#>   <dbl>  <dbl> <dbl>
#> 1 -2.35 0.0645 0.460

Создано 28 августа 2019 г. пакетом REPEX (v0.3.0)


person Arthur Yip    schedule 29.08.2019    source источник


Ответы (3)


Как указывает Лайонел, curly-curly работает внутри функций. Таким образом, чтобы использовать его с filter, вы должны заключить вызов внутри функции.

f <- function(.df, v) { 
  filter(.df, {{ v }} > 0) 
}

# Curly-curly provides automatic NSE support
f( A, var2 )
# # A tibble: 3 x 3
#     var1   var2   var3
#    <dbl>  <dbl>  <dbl>
# 1 -2.35  0.0645  0.460
# 2  0.429 0.959  -0.694
# 3 -0.890 2.42   -0.936

# Strings have to be first converted to symbols
f( A, !!sym("var3") )
# # A tibble: 3 x 3
#     var1    var2  var3
#    <dbl>   <dbl> <dbl>
# 1 -1.21  -0.477  0.134
# 2 -2.35   0.0645 0.460
# 3 -0.575 -0.511  0.575

Curly-curly предназначен для ссылки на один аргумент. Вы можете расширить его для работы с несколькими переменными через последовательное приложение с помощью purrr::reduce. (Не забудьте сначала преобразовать ваши строки в настоящие имена переменных!):

syms(varnames_2) %>% reduce(f, .init=A)
# # A tibble: 1 x 3
#    var1   var2  var3
#   <dbl>  <dbl> <dbl>
# 1 -2.35 0.0645 0.460
person Artem Sokolov    schedule 06.09.2019

{{ работает только внутри функций с аргументами функции. То же самое для ensym() и других операторов, начинающихся с en.

Если вы не находитесь в функции и у вас есть имена переменных в виде строк, вам понадобится !!sym(). Часть sym() преобразует имя переменной в объект кода (символ), а часть !! вставляет его на место.

person Lionel Henry    schedule 29.08.2019

Если paste(paste(varnames_2, "> 0"), collapse = " & ") - это главный вопрос. Вы должны построить аргументы фильтра.

library(tidyverse)
library(rlang)

set.seed(1234)
A <- matrix(rnorm(30),nrow = 10, ncol = 3) %>% as_tibble() %>% set_names(paste("var", seq(1:3), sep = ""))

# with variables as arguments
filter_gt0 <- function(d, ...) {
  conds <- ensyms(...)
  conds <- map(conds, ~quo(!!.x > 0))  
  d %>%
    filter(!!!conds)
}
A %>%
  filter_gt0(var2, var3)
# # A tibble: 1 x 3
# var1   var2  var3
# <dbl>  <dbl> <dbl>
#   1 -2.35 0.0645 0.460

# or with variables as input
conds <- quos(var2, var3)
filter_gt0_2 <- function(d, conds) {
  conds <- map(conds, ~quo(!!.x > 0))  
  d %>%
    filter(!!!conds)
}
A %>%
  filter_gt0_2(conds)
# # A tibble: 1 x 3
# var1   var2  var3
# <dbl>  <dbl> <dbl>
#   1 -2.35 0.0645 0.460
person r.user.05apr    schedule 29.08.2019