Это не совсем часть кластера. Это просто точки, которые не принадлежат ни к каким кластерам и могут быть в некоторой степени «проигнорированы».
Помните, что DBSCAN означает «Пространственная кластеризация приложений с шумом на основе плотности». DBSCAN проверяет, имеет ли точка достаточно соседей в указанном диапазоне для классификации точек в кластеры.
Но что происходит с точками, не соответствующими критериям попадания ни в один из основных кластеров? Что делать, если у точки недостаточно соседей в указанном радиусе, чтобы считаться частью кластера? Это точки, которым присвоена метка кластера -1
, и они считаются шумом.
И что?
Что ж, если вы анализируете точки данных и вас интересуют только общие кластеры, вы уменьшаете размер данных и устраняете шум. Или, если вы используете кластерный анализ для классификации данных, в некоторых случаях можно отбросить шум как выбросы.
При обнаружении аномалий важны также точки, не попадающие ни в одну категорию, так как они могут представлять проблему или редкое событие.
person
victor
schedule
25.07.2017