Как ввести порядковые данные в функцию гирлянды

У меня есть набор данных с 12 переменными, каждая из которых принимает значения от 1 до 4 и должна рассматриваться как порядковая. Если я не укажу их тип, они обрабатываются как интервальный тип

> attributes(gower_dist)
$class
[1] "dissimilarity" "dist"         

$Size
[1] 5845

$Metric
[1] "mixed"

$Types
 [1] "I" "I" "I" "I" "I" "I" "I" "I" "I" "I" "I" "I"

но если я добавлю 'type=list(ordratio=1:12)', тип станет 'T', и я уверен, что это означает. Если это не порядковый номер, то как мне сообщить маргаритке, что я ввожу порядковые данные?

> attributes(gower_dist)
$class
[1] "dissimilarity" "dist"         

$Size
[1] 5845

$Metric
[1] "mixed"

$Types
 [1] "T" "T" "T" "T" "T" "T" "T" "T" "T" "T" "T" "T"

person shavendy    schedule 19.08.2017    source источник
comment
Хотите поделиться правильным воспроизводимым примером?   -  person AkselA    schedule 19.08.2017


Ответы (1)


Короткий ответ:

Если вы указали порядковые отношения и заметили, что результирующий тип будет «T», это ожидаемое поведение.

Длинный ответ:

Я заглянул внутрь функции daisy. Существует 6 возможных значений атрибута Types:

typeCodes <- c("A", "S", "N", "O", "I", "T")

Я несколько раз прокручивал функцию в режиме отладки с разными параметрами. Сопоставление для этого атрибута выглядит следующим образом:

  • Если указать type = list(asymm=<whichever columns in the dataset>): "А"

  • Если указать type = list(symm=<whichever columns in the dataset>): "S"

  • Если указать type = list(ordratio=<whichever columns in the dataset>): "Т"

Если вы не укажете тип или укажете type=list(logratio=<whichever columns in the dataset>), столбцы вашего набора данных будут следующими:

  • факторы: "Н"

  • приказал: "О"

  • числовые / целые числа: "I"

(Не уверен, почему logratio не получает свой собственный тип, но, вероятно, здесь это не по теме...)

person Z.Lin    schedule 19.08.2017