работает ли mutate с функцией rep?

У меня есть закуска с названием «Таблица_ уверенности». Кто-нибудь знает, почему, если я попытаюсь добавить новый столбец с помощью глагола изменения, это не сработает?

# A tibble: 12 x 3
# Groups:   Age [2]
  Age   Condition       Prop
<fctr>    <fctr>      <dbl>
   0       old      0.73993056
   1       old      0.75590278
   0       old      0.15069444
   1       old      0.13090278
   0       new      0.06388889
   1       new      0.04965278
   0       new      0.05902778
   1       new      0.05416667
   0      lure      0.23055556
   1      lure      0.23645833
   0      lure      0.13819444
   1      lure      0.12013889

Я использовал эту функцию из базы r, и она работает

confidence_table$Confidence <- as.factor(rep(c("HC", "LC"), times = 3, each = 2))

# A tibble: 12 x 4
# Groups:   Age [2]
 Age   Condition     Prop Confidence
<fctr>    <fctr>      <dbl>     <fctr>
  0       old      0.73993056     HC
  1       old      0.75590278     HC      
  0       old      0.15069444     LC
  1       old      0.13090278     LC
  0       new      0.06388889     HC
  1       new      0.04965278     HC
  0       new      0.05902778     LC
  1       new      0.05416667     LC
  0      lure      0.23055556     HC
  1      lure      0.23645833     HC
  0      lure      0.13819444     LC
  1      lure      0.12013889     LC

Это ожидаемый результат, который работает с кодом base r. Однако, если я использую:

confidence_table <- confidence_table %>%
                    mutate(Confidence = rep(c("HC", "LC"), times = 3, each = 2))

он говорит: Ошибка в mutate_impl (.data, точки): Доверие столбца должно быть длиной 6 (размер группы) или один, а не 12

Что с этим не так?


person Lollo    schedule 16.12.2017    source источник


Ответы (1)


В этом случае сообщение об ошибке действительно должно помочь вам выяснить, где может быть проблема. Обратите внимание, что 2 x 3 x 2 = 12.

confidence_table %>%
  mutate(Confidence = rep(c("HC", "LC"), times = 3, each = 2))
# Error in mutate_impl(.data, dots) : 
#   Column `Confidence` must be length 6 (the group size) or one, not 12

Как указано в комментариях, один из способов решить эту проблему - сначала ungroup.

confidence_table %>%
  ungroup() %>%
  mutate(Confidence = rep(c("HC", "LC"), times = 3, each = 2))
# # A tibble: 12 x 4
#      Age Condition       Prop Confidence
#    <int>     <chr>      <dbl>      <chr>
#  1     0       old 0.73993056         HC
#  2     1       old 0.75590278         HC
#  3     0       old 0.15069444         LC
#  4     1       old 0.13090278         LC
#  5     0       new 0.06388889         HC
#  6     1       new 0.04965278         HC
#  7     0       new 0.05902778         LC
#  8     1       new 0.05416667         LC
#  9     0      lure 0.23055556         HC
# 10     1      lure 0.23645833         HC
# 11     0      lure 0.13819444         LC
# 12     1      lure 0.12013889         LC

Вы также можете сделать это без ungrouping:

confidence_table %>% 
  mutate(Confidence = rep(c("HC", "LC"), times = 3)) # 2x3 = 6
# # A tibble: 12 x 4
# # Groups:   Age [2]
#      Age Condition       Prop Confidence
#    <int>     <chr>      <dbl>      <chr>
#  1     0       old 0.73993056         HC
#  2     1       old 0.75590278         HC
#  3     0       old 0.15069444         LC
#  4     1       old 0.13090278         LC
#  5     0       new 0.06388889         HC
#  6     1       new 0.04965278         HC
#  7     0       new 0.05902778         LC
#  8     1       new 0.05416667         LC
#  9     0      lure 0.23055556         HC
# 10     1      lure 0.23645833         HC
# 11     0      lure 0.13819444         LC
# 12     1      lure 0.12013889         LC

Другой альтернативой может быть группировка по «Условию» - может быть, что-то вроде:

confidence_table %>% 
  group_by(Condition) %>% 
  mutate(Confidence = c("HC", "LC")[cumsum(Age == 0)])

Образец данных:

confidence_table <- structure(list(Age = c(0L, 1L, 0L, 1L, 0L, 1L, 0L, 1L, 0L, 1L, 
    0L, 1L), Condition = c("old", "old", "old", "old", "new", "new", 
    "new", "new", "lure", "lure", "lure", "lure"), Prop = c(0.73993056, 
    0.75590278, 0.15069444, 0.13090278, 0.06388889, 0.04965278, 0.05902778, 
    0.05416667, 0.23055556, 0.23645833, 0.13819444, 0.12013889)), .Names = c("Age", 
    "Condition", "Prop"), row.names = c(NA, -12L), class = c("grouped_df", 
    "tbl_df", "tbl", "data.frame"), vars = "Age", drop = TRUE, indices = list(
        c(0L, 2L, 4L, 6L, 8L, 10L), c(1L, 3L, 5L, 7L, 9L, 11L)), group_sizes = c(6L, 
    6L), biggest_group_size = 6L, labels = structure(list(Age = 0:1), row.names = c(NA, 
    -2L), class = "data.frame", vars = "Age", drop = TRUE, .Names = "Age"))
person Community    schedule 17.12.2017