Coursera/Stanford Машинное обучение: контролируемое, неконтролируемое, обучение с подкреплением

Прежде чем углубляться в значение машинного обучения, всегда полезно получить представление о поле, зная несколько реальных примеров, в которых используется эта концепция.

Список нескольких примеров машинного обучения, которые мы используем каждый день и которые основаны на машинном обучении.

Рекомендация по продукту: веб-сайты электронной коммерции (например, Amazon), телешоу (например, Netflix) рекомендуют нам, какой продукт купить или какие шоу посмотреть на основе нашей истории на платформе. Сайты могут делать это, анализируя поведение тех, кто имеет аналогичные онлайн-привычки на этих сайтах.

Обнаружение мошенничества в Интернете. Компании используют машинное обучение для защиты от отмывания денег. Они сравнивают миллионы происходящих транзакций и различают их как законные/незаконные.

Определение машинного обучения

На протяжении многих лет различные компьютерщики давали свое определение ML. Ниже перечислены те немногие, которые часто вызывают дискуссии.

Область исследования, которая дает компьютерам возможность учиться без явного программирования. - Артур Сэмюэл (1959)

Известно, что Сэмюэл написал программу, которая научилась играть в шашки лучше, чем он. (Ссылка на статью о том же).

Правильно поставленная задача обучения: говорят, что компьютерная программа учится на опыте E в отношении некоторой задачи T и некоторого показателя производительности P, если ее производительность на T, измеряемая P, улучшается с опытом E. —Том Митчелл (1998)

Согласно определению Митчелла, мы можем сказать для программы игры в шашки: Задача T системы состоит в том, чтобы играть в игру в шашки. Показателем производительности P может быть процент игр, выигранных системой. Здесь опыт E — это набор всех сыгранных игр.

Класс состоит из 4 основных разделов: Обучение с учителем, Обучение без учителя, Теория обучения и Обучение с подкреплением.

Контролируемое обучение

В обучении с учителем алгоритму предоставляются обучающие данные, которые содержат «правильный ответ» для всех примеров.

Предположим, вы продаете свой дом и хотите узнать, какой будет хорошая рыночная цена. Один из способов сделать это — сначала собрать информацию о недавно проданных домах и составить модель цен на жилье.

Например, алгоритм обучения с учителем для прогнозирования цен на жилье будет принимать в качестве входных данных набор параметров, влияющих на него, скажем, площадь дома. Данные обучения также содержат информацию о ценах на каждый дом.

Он называется «Контролируемый», потому что мы контролируем алгоритм обучения.

Как вы можете видеть выше на графике, дата цен на жилье содержит информацию о ценах всех домов в базе данных по отношению к их площади.

Теперь, если кто-то продавал свой дом в том же регионе, из которого получены эти данные, и хочет, чтобы алгоритм сказал им, по какой цене они должны продать свой дом. Есть много способов сделать это.

Можно создать прямую линию через данные, а затем относительно площади рассматриваемого дома увидеть соответствующую цену.
Можно создать квадратную функцию (кажется, лучше подходит) через данные и сделать то же самое.

Жилищная проблема — это пример проблемы регрессии. Регрессия относится к тому факту, что переменная, которую мы пытаемся предсказать, представляет собой непрерывную цену.

Проблема классификации. Переменная, которую пытаются предсказать в этом случае, является дискретной, а не непрерывной.

Например, электронное письмо с текстом может быть классифицировано как спам или не спам.

Задача классификации требует, чтобы примеры были отнесены к одному из двух или более классов.
Классификация может иметь действительные или дискретные входные переменные.

Неконтролируемое обучение

Эти алгоритмы выводят закономерности из набора данных без маркировки, классификации или классификации. Грубо говоря, учитывая набор данных, вы бы попросили алгоритм найти интересные структуры в наборе.

Кластеризация может быть одним из примеров такого типа обучения. При этом кластеры будут формироваться вокруг данных с аналогичной структурой.

Алгоритмы неконтролируемого обучения используются в различных задачах:

Обработка изображений (для группировки похожих пикселей вместе)
Анализ социальных сетей
Астронавтические данные
Сегментация рынка
Эффект коктейля
Чтобы понять данные генов

Обучение с подкреплением

При обучении с подкреплением искусственный интеллект сталкивается с игровой ситуацией. Компьютер использует метод проб и ошибок для решения проблемы. Чтобы заставить машину делать то, что она хочет, алгоритм разработан таким образом, что он либо вознаграждает, либо наказывает за действия. Цель состоит в том, чтобы максимизировать общее вознаграждение.

Обучение с подкреплением можно использовать в таких областях, как робототехника, создание шахматной программы.

Предварительные требования к курсу

Базовые знания программирования и структур данных
Знакомство с вероятностью и статистикой
Базовое понимание линейной алгебры
Знание одного из языков программирования, желательно MATLAB/Octave

Также читайте: Мой первый опыт участия в хакатоне!