Weka DBSCAN кластеризация, как получить основную точку

Я использую DBSCAN для кластеризации данных после кластеризации для каждого кластера, который я хочу получить значение атрибута данных основной точки, есть ли способ сделать это?

 private static void ClusteringDemo(String filename) throws Exception {
    ClusterEvaluation eval;
    Instances  data;
    DBSCAN cl;
    data = DataSource.read(filename);

    // manual call
    cl  = new DBSCAN();
    cl.setMinPoints(6);
    cl.setEpsilon(0.05);
    cl.buildClusterer(data);
    eval = new ClusterEvaluation();
    eval.setClusterer(cl);
    eval.evaluateClusterer(new Instances(data));
    System.out.println(eval.clusterResultsToString());

    //setup visualization
    PlotData2D predData = ClustererPanel.setUpVisualizableInstances(data, eval);
    VisualizePanel vp = new VisualizePanel();
    vp.addPlot(predData);

    // display data
    JFrame jf = new JFrame("Weka Clusterer Visualize: " + vp.getName());
    jf.setDefaultCloseOperation(JFrame.DISPOSE_ON_CLOSE);
    jf.setSize(500, 400);
    jf.getContentPane().setLayout(new BorderLayout());
    jf.getContentPane().add(vp, BorderLayout.CENTER);
    jf.setVisible(true);
}

cl - это класс DBSCAN, и я реализую только визуализацию. Кто-нибудь может научить меня, как получить значение основного балла?


person printemp    schedule 23.09.2015    source источник


Ответы (1)


Не существует такого понятия, как «стоимость основного балла».

DBSCAN не использует центры кластеров, как k-mean.

Рассмотрим это изображение DBSCAN (Википедия). Где могла бы быть «основная ценность» красного кластера?

Кластеры могут иметь произвольную форму, и тогда «центра» нет. Фактически, среднее значение всех точек может быть за пределами кластера.

Кластер имеет по крайней мере одну точку ядра, но их может быть намного больше - все они могут быть основными точками одновременно. Таким образом, информация о том, какие точки являются ключевыми, не очень важна. Если я правильно помню, у ELKI есть возможность раскрыть эту информацию, но по умолчанию она немедленно удаляется.

person Has QUIT--Anony-Mousse    schedule 23.09.2015