В чем измеряется уравнение Хаверсина для анализа DBSCAN в RapidMiner?

Когда я использую алгоритм кластеризации DBSCAN в RapidMiner, я не уверен, какое значение уравнение Хаверсина использует в качестве эпсилон. Набор данных, с которым я сейчас работаю, закодирован в градусах широты и долготы. Я хочу, чтобы измерение идеально измеряло расстояние в 200 метров. Что мне нужно включить в эпсилон, чтобы это работало?

настройка dbscan epsilon


person Lou Klein    schedule 02.06.2015    source источник
comment
продолжайте и включите ссылку на свое изображение, кто-то отредактирует ваш вопрос и включит его. :)   -  person Barett    schedule 02.06.2015
comment
Добрый день, пользователь Barett! Ссылка теперь включена.   -  person Lou Klein    schedule 02.06.2015
comment
Вы смотрели исходный код? Или вы не можете сделать вывод из своей дендрограммы, какой масштаб у пользователей Rapidminer? Я использовал только ELKI: он использует счетчики, и индексы очень быстрые для таких данных.   -  person Has QUIT--Anony-Mousse    schedule 02.06.2015
comment
Спасибо пользователю Barett за вставку изображения! @ Anony-Mousse, кроме всего вышеперечисленного. Я, к сожалению, не знаю, как получить доступ к исходному коду RapidMiner, а FAQ дает лишь расплывчатое описание epsilon, т.к. этот параметр определяет параметр epsilon алгоритма DBSCAN. epsilon задает размер окрестности. Диапазон: реальный. Хотя это не является неточным, кажется, что это применимо только для известных единиц измерения расстояний. Я не знаю, что такое вывод, включены широтные/долготные десятичные градусы.   -  person Lou Klein    schedule 02.06.2015
comment
github.com/rapidminer/rapidminer за исключением того, что они публикуют только старые версии Rapidminer с открытым исходным кодом... Также имейте в виду, что порядок lat,lng или lng,lat не всегда используется последовательно. Если вы поменяете их местами, результаты будут хаосом. Так что вам действительно нужно найти их документацию по расстоянию Хаверсина! (НЕ документация dbscan!) ELKI сообщает, что использует метры, и у них есть версии для каждого порядка параметров.   -  person Has QUIT--Anony-Mousse    schedule 03.06.2015


Ответы (1)


Расстояние гаверсинуса не является частью обычного набора функций расстояния, предоставляемых RapidMiner. Вы случайно не установили какие-либо расширения, которые включают это расстояние? Если это так, вы должны проверить их документацию или исходный код.

person David    schedule 03.06.2015