Перефразируйте ввод данных для диаграмм Санки с помощью sankeyPlot () в пакете networkD3

Я пытаюсь построить диаграммы Санки, используя sankeyPlot () в пакете networkD3. Визуализация отлично работает с такими образцами данных, как этот

Узлы

node
1124107186
1124132760
1124119016
20150517
/matte-low-dome-49354
/accounts/account-order-list.html
/Stepp

и ссылки

 source target   value
0        3       5
1        3       9
2        3       1
3        4       6
3        5       12
3        6       8

Но сделать таблицу ссылок из файла csv в формате

       URI                          DATE_KEY    TIME_KEY GUID_KEY
/matte-low-dome-49354               20150517    145755  1124107186
/matte-low-dome-49355               20150517    145755  1124107186
/accounts/account-order-list.html   20150517    143857  1124132760
/accounts/account-order-list.html   20150517    143857  1124132760
/Stepp                              20150517    143416  1124119016
/Stepp                              20150517    143415  1124119016
/platinum-47184                     20150517    145637  1124107186

Есть ли воспроизводимый способ подготовить исходные и целевые номера строк для такого набора данных?


person Kinjal    schedule 07.07.2015    source источник


Ответы (1)


Я нашел способ сделать это в Excel с помощью vlookup и pivot. Я присвоил номера строк каждой уникальной записи переменной, используя row ()

variable          row
20150517           1
20150518           2
/platinum-47184    3

и выполнил vlookup с его именем в другой таблице, таким образом получая источник и цель в виде их порядковых номеров. Затем я выполнил сводную таблицу, чтобы получить количество каждой уникальной комбинации переменных, например:

 source                              target   value
/matte-low-dome-49354               20150517    12 
/matte-low-dome-49355               20150517    6

Я смог использовать это в качестве исходных данных для создания сюжета Санки.

Это не очень программируемый способ сделать это, но он служит цели.

person Kinjal    schedule 16.07.2015