Алгоритмы машинного обучения — что вам нужно знать

Давайте начнем с того, что означает алгоритм и что он может сделать для кода, который мы пишем на любом из языков.

Что ж, алгоритм можно определить так: «В математике и информатике алгоритм — это недвусмысленная спецификация того, как решать класс задач. Алгоритмы могут выполнять вычисления, обработку данных и автоматические логические задачи», или, говоря простым языком, это можно интерпретировать как «алгоритм — это компьютерная процедура, которая во многом похожа на рецепт (называемый процедурой) и сообщает ваш компьютер точно, какие шаги нужно предпринять, чтобы решить проблему или достичь цели. Ингредиенты называются входами, а результаты — выходами».

ЧТО ТАКОЕ АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ? ? ? ? ? ?

Ну, в основном алгоритмы машинного обучения также похожи на общие типы алгоритмов, которые мы видим в нашей повседневной жизни, например, алгоритм вождения автомобиля может быть таким: A. возьмите ключи от машины B. Проверьте топливо в машине ( или электричество, если у вас есть Tesla) C. Пристегните ремень безопасности. D. Наконец, запустите двигатель. Точно так же алгоритм машинного обучения можно изобразить в нескольких типах случаев, основываясь на способности машин понимать, чему мы пытаемся их научить.

В этом посте мы увидим три типа алгоритмов и их подкатегории:

В целом алгоритмы машинного обучения делятся на три типа:

Контролируемое обучение
Обучение без учителя
Обучение с подкреплением

И. ОБУЧЕНИЕ С КОНТРОЛЕМ:

Обучение с учителем — это то, что можно выразить как обучение, управляемое задачами. Здесь машина учится на предыдущих типах выборочных входных данных и выборочных выходных данных и пытается узнать как можно больше, чтобы попытаться предсказать новый набор примеров, когда он будет показан.

Реальный пример сделает вас кристально ясным по этой теме:

Вам дан набор данных, который отображается следующим образом.

Кстати, как специалист по данным или инженер по машинному обучению, мы всегда будем работать с файлами типа .csv (значения, разделенные запятыми) или файлами типа excel почти в большинстве случаев, так что промойте руки в Excel .

Наш набор данных выглядит как на изображении выше, где у нас есть две строки A и B.

A-› Многолетний опыт
Б -> Зарплата

Итак, наша проблема здесь состоит в том, чтобы заставить нашу модель машинного обучения использовать любой из алгоритмов, чтобы заставить ее учиться, чтобы, когда мы придаем ей новое значение, мы могли получить прогнозируемый результат.

Поскольку вход A и выход B даны нам в задаче, это будет тип обучения с учителем.

Известные алгоритмы контролируемого обучения:

Регрессия
Деревья
Случайный лес
Классификация

2. Неконтролируемое обучение:

Предположим, что вам даны только входные данные, и это все, что вам нужно, чтобы найти некоторые закономерности из входных данных или, в терминах ML, кластеры из входных данных, и они делают прогноз в соответствии с ними, что ж, это неконтролируемое обучение.

Как вы могли видеть на рисунке выше, мы формируем три кластера в зависимости от нашего набора входных данных. В этом случае нам дается куча одежды, которую необходимо разделить по размерам: маленький (S), средний (M), большой (L). Мы формируем три кластера, чтобы сгруппировать их, и когда мы получаем футболку размера X, для которой мы хотим предсказать размер, в который она поместится, мы можем легко сопоставить их координаты и сгруппировать их в соответствии с их типом кластера. подойдет.

Типичный набор данных для задачи обучения без учителя будет выглядеть следующим образом:

У нас есть задача, в которой нам нужно сгруппировать различные типы клиентов на основе их оценки расходов в определенном торговом центре.

Обычно используемые неконтролируемые алгоритмы:

кластеризация k-средних
Иерархическая кластеризация

3. Обучение с подкреплением:

Согласно Википедии, «Обучение с подкреплением — это область машинного обучения, вдохновленная бихевиористской психологией и связанная с тем, как программные агенты должны выполнять действия в среде, чтобы максимизировать некоторое понятие совокупного вознаграждения».

Обучение в основном работает с концепцией следа и ошибки, когда каждый раз, когда данные изучаются на примере, в зависимости от его вознаграждения или наказания наша модель становится очень точной.

Одним из примеров в реальном времени является то, как alpha go использовала обучение с подкреплением, чтобы обучить свою модель победе над чемпионом мира по GO.

Набор данных для обучения с подкреплением будет выглядеть следующим образом:

Нам дается набор данных для проверки вероятности того, что пользователь нажмет на конкретное объявление или нет.

Общие алгоритмы:

UCB (верхняя доверительная граница)
Выборка Томпсона

Мы подошли к концу блога. Поздравляем с изучением трех алгоритмов, которые служат основой для машинного обучения.

Поделитесь этим постом, если он вам понравился :)

посетите мой веб-сайт для более интересных статей по AI/DL/DS/ML в очень упрощенной форме https://mytakeondata.wordpress.com/

Алгоритмы машинного обучения — что вам нужно знать

Похожие вопросы