это данные, с которыми я работаю:
> data
Segment Product Value Key
1 non-domestic S1 517.50760307564053 Actuals Sales
2 non-domestic S2 1235.3088913918129 Actuals Sales
3 non-domestic S3 2141.6841816176966 Actuals Sales
4 domestic S1 -958.38836859580044 Actuals Sales
5 domestic S2 -1129.5593769492507 Actuals Sales
6 domestic S3 -137.68477107274975 Actuals Sales
7 non-domestic S1 -296.07559218703756 Quarter Sales
8 non-domestic S2 1092.0390648120747 Quarter Sales
9 non-domestic S3 1156.2866848179935 Quarter Sales
10 domestic S1 -1975.0222255105061 Quarter Sales
11 domestic S2 -2549.8125184965966 Quarter Sales
12 domestic S3 -2608.2434152116011 Quarter Sales
Я пытаюсь разложить его, чтобы получить таблицу с 6 строками и 4 столбцами (Segment, Product, Actuals Sales, Quarter Sales
) без пропущенных значений
spread(data=data, key=Key, value=Value)
К сожалению, я получаю вот что. Я понимаю, что это потому, что в столбцах Segment
и Product
есть неуникальные значения.
Segment Product Actuals Sales Quarter Sales
1 domestic S1 -958.38836859580044 <NA>
2 domestic S2 -1129.5593769492507 <NA>
3 domestic S3 -137.68477107274975 <NA>
4 domestic S1 <NA> -1975.0222255105061
5 domestic S2 <NA> -2549.8125184965966
6 domestic S3 <NA> -2608.2434152116011
7 non-domestic S1 517.50760307564053 <NA>
8 non-domestic S2 1235.3088913918129 <NA>
9 non-domestic S3 2141.6841816176966 <NA>
10 non-domestic S1 <NA> -296.07559218703756
11 non-domestic S2 <NA> 1092.0390648120747
12 non-domestic S3 <NA> 1156.2866848179935
Не могли бы вы помочь мне, как я могу удалить недостающие значения и создать таблицу, в которой значения в первых двух столбцах не дублируются?
Вот воспроизводимый пример:
> dput(data)
structure(list(Segment = c("non-domestic", "non-domestic", "non-domestic",
"domestic", "domestic", "domestic", "non-domestic ", "non-domestic ",
"non-domestic ", "domestic ", "domestic ", "domestic "), Product = c("S1",
"S2", "S3", "S1", "S2", "S3", "S1", "S2", "S3", "S1", "S2", "S3"
), Value = c("517.50760307564053", "1235.3088913918129", "2141.6841816176966",
"-958.38836859580044", "-1129.5593769492507", "-137.68477107274975",
"-296.07559218703756", "1092.0390648120747", "1156.2866848179935",
"-1975.0222255105061", "-2549.8125184965966", "-2608.2434152116011"
), Key = c("Actuals Sales", "Actuals Sales", "Actuals Sales",
"Actuals Sales", "Actuals Sales", "Actuals Sales", "Quarter Sales",
"Quarter Sales", "Quarter Sales", "Quarter Sales", "Quarter Sales",
"Quarter Sales")), .Names = c("Segment", "Product", "Value",
"Key"), row.names = c(NA, -12L), class = "data.frame")
dput()
для создания воспроизводимой и совместно используемой версии вашего фрейма данных. - person Pedro Alencar   schedule 11.06.2021data$Segment <- trimws(data$Segment)
, тогда ваша команда распространения - person Hobo   schedule 11.06.2021