Сравните сходство между графиками?

У меня есть несколько концептуальных карт, представленных в виде направленных графов. Я использовал этот метод для сравнения двух концептуальных карт, но теперь я нравится классифицировать / группировать похожие графики вместе.

Насколько мне известно, традиционный алгоритм кластеризации принимает входные данные в виде многомерных точек данных. Но я также читал, что трудно и не рекомендуется преобразовывать график в вектор.

В таком случае, как мне подойти к этой проблеме?


person Samuel Bushi    schedule 14.06.2016    source источник


Ответы (1)


Многие (большинство, за исключением, например, k-средних, EM и среднего сдвига) алгоритмов кластеризации используют расстояния, а не точки.

Для небольших наборов данных иерархическая кластеризация, безусловно, является первым методом, который стоит попробовать. К однозвенным, полным и средним соединениям предъявляются небольшие формальные требования, т. е. они могут использоваться как с расстоянием, так и со сходством, что не обязательно удовлетворять неравенству треугольника. Другие метрики, такие как связь Уорда и центроида, требуют возведения в квадрат евклидовых расстояний и, вероятно, не будут работать здесь.

  1. вычислить попарные расстояния сопоставления графов
  2. проверьте требуемую нормализацию (например, размер графика)
  3. запустить иерархическую кластеризацию
  4. изучите дендрограмму, возможно, вам придется вернуться и улучшить нормировку, расстояние и т. д.
  5. вырезать кластеры поддеревьев из дендрограммы
person Has QUIT--Anony-Mousse    schedule 16.06.2016