диагональное значение в матрице совместной встречаемости

Я новичок и заранее большое спасибо за совет

Я хочу создать матрицу совместной встречаемости и перейти по ссылке ниже

Как использовать R для создания слова co- матрица вхождений

но я не могу понять, почему значение A-A равно 10 в матирксе ниже. Оно должно быть 4, не так ли? потому что есть четыре A

dat ‹- read.table (text = 'film tag1 tag2 tag3

  • 1 A A A

  • 2 A C F

  • 3 B D C ', заголовок = T)

crossprod (as.matrix (mtabulate (as.data.frame (t (dat [, -1])))))

( ) A C F B D

A 10 1 1 0 0

C 1 2 1 1 1

F 1 1 1 0 0

B 0 1 0 1 1

D 0 1 0 1 1


person Charley    schedule 01.11.2017    source источник


Ответы (1)


Используемое вами решение предполагает, что каждый тег появляется только один раз в фильме, что, насколько я могу судить, совпадает с определением матрицы совпадения. Следовательно, каждый A в первой строке считается совпадающим с самим собой и с двумя другими A, в результате чего получается десять совпадений при факторинге A во второй строке.

person Haem    schedule 01.11.2017
comment
Большое спасибо ! Я понял - person Charley; 02.11.2017
comment
@Charley Пожалуйста. Вы можете отметить этот ответ как принятый, щелкнув значок галочки под подсчетом голосов. - person Haem; 02.11.2017