Кластеризация в Gephi (метод Лувена)

Я начал работать с gephi, чтобы помочь мне отобразить набор данных. Набор данных содержит:

теги (термины для определенного изображения) как узлы

Нормализованное расстояние сходства Google между этими тегами как края с весом (от 0 до 1).

Каждый тег связан со всеми остальными тегами, если они оба принадлежат одному и тому же изображению. Итак, у меня есть один кластер узлов и краев для каждого изображения.

Я импортировал этот набор данных в gephi в следующем формате:

узлы: идентификатор, метка

края: цель, источник, вес (от 0 до 1)

Как 500 узлов и 6000 ребер.

Моя проблема теперь в том, что после импорта всех этих узлов и ребер график выглядит как бы сгруппированным без реального порядка. Каждый кластер каждого изображения смешивается с другими кластерами других изображений. Теперь при использовании алгоритма модульности как разделения (который должен использовать метод Лувена) график становится цветным, каждый цвет представляет собой изображение. Теперь я могу разделить этот беспорядок, используя раскладку Force Atlas 2.

Теперь у меня есть цветной график с примерно 15 кластерами (каждый кластер соответствует 1 картинке)

Теперь я хочу снова сгруппировать эти кластеры, используя теги (узлы) в соответствии с их нормализованным расстоянием в Google (вес ребер), которые затем должны быть тегами, которые несколько равны по своему значению.

Надеюсь, вы понимаете, чего я хочу добиться. Я также могу загрузить картинку, чтобы прояснить это.

Большое спасибо


person puelo    schedule 30.04.2013    source источник


Ответы (2)


Я не думаю, что вы можете сделать это со стандартной версией Gephi. Вам нужно будет разработать плагин для реализации самого последнего шага вашего процесса.

Gephi хорош для визуализации и просмотра графиков, но (на данный момент) есть более полные инструменты, когда дело доходит до обработки топологических свойств. например, вам может подойти библиотека igraph (доступная на языках C, R и python). И обратите внимание, что вы можете использовать формат файла, совместимый как с Gephi, так и с igraph, что позволяет использовать оба инструмента для одних и тех же данных.

person Vincent Labatut    schedule 04.05.2013
comment
Можете ли вы описать, как igraph обрабатывает выбросы, я имею в виду, что они сливаются в большой кластер и создают кластеры выбросов, если есть 3,4 точки вместе, но далеко от всех остальных. - person Khalid Usman; 19.04.2019

Я смог решить свою проблему. Мне пришлось импортировать каждый из этих 15 кластеров отдельно. Таким образом, я мог использовать метод модульности только для этих немногих.

person puelo    schedule 08.05.2013