В этой статье мы рассмотрим различные меры расстояния, которые мы будем использовать в машинном обучении.
1. Евклидово расстояние (L2):
Евклидово расстояние — наиболее часто используемая мера расстояния.
Если мы наблюдаем приведенную выше картину, переменная «d» называется евклидовым расстоянием (L2). Это называется кратчайшим расстоянием от X1 до X2.
На рисунке выше у нас есть две функции, f1 и f2, и две точки данных в 2D, X1 и X2.
Евклидово расстояние можно сформулировать как
2. Манхэттенское расстояние (L1):
Манхэттенское расстояние — следующая часто используемая и простая мера расстояния.
Из приведенного выше графика манхэттенское расстояние можно сформулировать следующим образом:
3. Расстояние Минковского (LP):
Расстояние Минковского является обобщенной мерой расстояния и может быть сформулировано как
Когда p=1 в расстоянии Минковского, оно становится Манхэттенским расстоянием, а когда p=2 — евклидовым расстоянием
Манхэттенское расстояние также называется L1-нормой, а Евклидово расстояние называется L2-нормой.
4. Расстояние Хэмминга:
Расстояние Хэмминга широко используется при обработке текста и дает нам # разности значений между измерениями в векторах. Расстояние Хэмминга будет использоваться в последовательности генов.
Приведенная выше последовательность генерирует значение 2, поскольку существует разница значений в 7 и 10 измерениях.
Есть и другие меры, и мы узнаем о некоторых из них в будущем. Одними из таких важных и широко используемых показателей являются Косинусное расстояние и Косинусное сходство, мы увидим это в следующих статьях.
Нижняя линия:
Есть много мер расстояния, которые используются в машинном обучении, и некоторые из них — это манхэттенское расстояние, евклидово расстояние, расстояние Минковского и расстояние Хэмминга. Есть и другие меры расстояния, которые также широко используются, и мы увидим их в следующих статьях.
Надеюсь, вам понравилась эта статья, и, пожалуйста, поделитесь своим мнением.
Первоначально опубликовано на https://cskuracha.github.io 4 апреля 2021 г.