Есть ли способ ввести список доступности в Optics Xi из ELKI и получить кластеры?

У меня возникли проблемы с вводом данных в ELKI для правильного выполнения алгоритма Optics, но, используя реализацию R для Optics, я могу легко получить список расстояний досягаемости. Я могу записать их в такой файл. (индекс, расстояние)

1 Инф

2 0.5

3 0.9 ...

Я хочу найти кластеры, разделенные локальными минимумами. Я думаю, что это делает алгоритм Optics Xi из программного обеспечения ELKI, но, поскольку у меня возникли проблемы с импортом моих данных, я не могу его использовать.

Не проще ли просто написать алгоритм извлечения кластера Optics на другом языке, используя псевдокод из статьи Optics? Я думаю, что в своей основе это просто кластеризация индексов, когда они находятся рядом друг с другом, и нет снижения до нового локального минимума.

Спасибо


person Froblinkin    schedule 04.01.2016    source источник
comment
Бьюсь об заклад, есть интерфейс Java, который вам просто нужно реализовать. В ELKI кажется, что все имеет интерфейс для подключения. Но может быть проще исправить некоторые проблемы, так как ELKI работает очень хорошо (не забудьте включить индекс и установить верхнюю границу для эпсилон - это значительно ускоряет). Похоже, это единственная пригодная для использования реализация OPTICS.   -  person Has QUIT--Anony-Mousse    schedule 05.01.2016


Ответы (1)


Вы можете попробовать реализовать интерфейс OPTICSTypeAlgorithm, что в значительной степени означает чтение ваших данных и их сохранение в объекте типа ClusterOrder.

Однако ELKI включает слегка усовершенствованную версию OPTICS, которая дает лучшие результаты с OPTICSXi. Детали в конечном итоге будут опубликованы в виде технического отчета или около того. Данных, полученных от реализации R, недостаточно для исправления некоторых распространенных артефактов на графике OPTICS.

Пожалуйста, используйте версию OPTICS в ELKI. Попробуйте индекс дерева обложек (довольно быстрый и простой в использовании). Избегайте использования столбцов идентификаторов во входных данных или сообщите синтаксическому анализатору, какой столбец является столбцом идентификатора.

person Erich Schubert    schedule 05.01.2016
comment
У меня есть предварительно вычисленная матрица расстояний, которую я переформатировал в попарное расстояние из трех столбцов. то есть 1 2 0,0895585119724274 - person Froblinkin; 05.01.2016
comment
Когда я использую такой вывод: Когда я использую такие параметры ELKI: Параметры: -dbc DBIDRangeDatabaseConnection -idgen.start 1 -idgen.count 2424 -time -algorithm clustering.optics.OPTICSList -algorithm.distancefunction external.FileBasedDoubleDistanceFunction -distance. matrix /Users/jperrie/Documents/col3elki.csv -optics.epsilon 5.0 -optics.minpts 2 -resulthandler ResultWriter -out /Applications/elki-0.7.0/opticslisttest1 Список оптики, похоже, не работает :( - person Froblinkin; 05.01.2016
comment
Я думаю, что я делаю что-то не так со списком из 3 столбцов. - person Froblinkin; 05.01.2016