Машина опорных векторов: машины опорных векторов являются частью контролируемых методов обучения, которые можно использовать для классификации, регрессии, а также для обнаружения выбросов (если вы не знаете, что такое выбросы на самом деле, сделайте посмотрите мой предыдущий блог)
Машины опорных векторов (SVM) — популярный выбор среди машинного обучения. Благодаря их способности решать как линейные, так и нелинейные задачи классификации. SVM особенно хорошо подходят для обработки многомерных данных. ✨
📍 В SVM основная цель — найти гиперплоскость, которая лучше всего разделяет различные классы во входных данных
Добро пожаловать в другой алгоритм контролируемого машинного обучения, т. е. машину опорных векторов.🧠💡
Предположим, у нас есть набор данных о фруктах, и мы хотим их классифицировать.
Например, рассмотрим манго и яблоко.
У нас есть информация об этих фруктах, например их цвет и вес.
Мы будем использовать SVM для классификации этих фруктов по соответствующим категориям, что и будет нашей главной целью.
Теперь нам нужно найти линию, которая как можно лучше разделяет два класса.
⭐ Эта линия называется гиперплоскостью в SVM ⭐
Может быть несколько возможных гиперплоскостей, которые могут разделять данные. Но мы хотим найти тот, который максимизирует разницу между двумя классами.
⭐ Поля — это расстояние между гиперплоскостью и ближайшими точками данных для каждого класса ⭐
📍 Алгоритм SVM выбирает гиперплоскость, которая максимизирует этот запас, что приводит к лучшей производительности классификации.
Мы просто подставляем значения веса и цвета нового фрукта в SVM.
📍 он предскажет, является ли фрукт манго или яблоком, в зависимости от того, на какую сторону гиперплоскости он падает
SVM — это мощный алгоритм классификации, который работает, находя гиперплоскость, которая лучше всего разделяет различные классы во входных данных.
📍 Алгоритм достигает этого, максимизируя разницу между двумя классами, что приводит к лучшей производительности классификации, что в конечном итоге даст нам максимальную точность. 💡
Нам нужно помнить об этом:
1. Максимизация маржи. Основная концепция SVM состоит в том, чтобы найти гиперплоскость, которая максимизирует маржу между классами. Максимизация запаса поможет улучшить обобщение модели, уменьшив переоснащение.
2. Регуляризация: SVM используют регуляризацию для контроля компромисса между максимизацией маржи и минимизацией ошибок классификации. Это дает идеальный баланс между переоснащением и недообучением, что напрямую может дать нам лучшую производительность. ✨📊
Я также загрузил файл на Github, в котором я взял «Набор данных семян тыквы», который я получил от Kaggle. Не забудьте посмотреть!
Также подписывайтесь на меня в Linkedin: