Введение

Изучение данных

В век информации данные будут определять выживание наиболее приспособленного бизнеса. Данные — это новая нефть, а ИИ — это новое электричество. Согласно Википедии, «ИИ — это интеллект, демонстрируемый машинами в отличие от интеллекта, демонстрируемого людьми и животными». Компьютерные машины будут учиться и демонстрировать интеллект, используя данные и алгоритмы. Традиционно компьютеры программировались с использованием различных входных данных и бизнес-правил, программисты программировали и передавали эту программу компьютеру для выполнения. Компьютеры, выполняя эту программу, определенную правилами, генерируют выходные данные.

источник изображения

«Машинное обучение — это область исследования, которая позволяет компьютеру учиться без явного программирования», — Артур Сэмюэл, 1959 г. В эпоху ИИ и машинного обучения нам не нужно определять явные правила для различных входных данных. Если у нас есть данные о входных данных и известных выходных данных, машины могут использовать алгоритмы, учиться на данных и разрабатывать правила, возможно, не хуже людей или даже лучше. Если в эти Правила подается новый вход, могут быть сгенерированы прогнозируемые результаты, которые будут служить бизнес-потребностям. Эти правила — не что иное, как модели машинного обучения.

источник изображения

Различные типы обучения на основе данных

ИИ и машинное обучение — это развивающаяся область, исследуются и изобретаются новые способы обучения на основе данных. На очень высоком уровне обучение на основе данных можно разделить на 3 более широкие категории.

  1. контролируемое обучение
  2. Неконтролируемое обучение
  3. Обучение с подкреплением

Каждая из этих категорий также имеет их комбинацию, которая создает новую категорию для себя, например, полуконтролируемое обучение и др.

Контролируемое обучение

Обучение с учителем имеет данные в формате заданного набора входных данных, у нас есть известный выход. На изображении ниже для каждого изображения (известный вход) у нас есть метка, утка или нет (известный результат), если у нас есть большой набор известных входов и известных хорошо размеченных выходов, мы можем использовать несколько алгоритмических методов классификации контролируемых научиться строить прогностическую модель. Используя прогностическую модель для любого нового изображения, для которого мы не знаем метку, мы можем точно предсказать метку «утка» или «не утка». Используя методы глубокого обучения, мы теперь можем превзойти человеческий уровень точности.

Примеры:
классификация : классификация электронных писем, спам или не спам
регрессия : прогнозирование цен на жилье
временной ряд: прогнозирование температуры воздуха

источник изображения

Обучение без учителя

Неконтролируемое обучение имеет входные данные, у него нет меток. Мы будем использовать входные данные и кластеризовать данные, чтобы найти закономерности в данных. На изображении 2 ниже для набора входных изображений мы можем применить неконтролируемые алгоритмы, такие как алгоритм кластеризации, и сгруппировать всех уток, кроликов, микки на основе различных характеристик входных изображений. Неконтролируемое обучение также используется в качестве методов разработки признаков, таких как PCA, для уменьшения размерности данных. Мы изучаем различные скрытые шаблоны и функции, используя неконтролируемое обучение.

Примеры:

кластеризация, обнаружение аномалий, уменьшение размерности

источник изображения

Обучение с подкреплением

Обучение с подкреплением — это особый тип обучения, при котором для данного агента использования, среды мы учимся на данных о различных состояниях, действиях и долговременном вознаграждении на основе предыдущего состояния или действия. Агент учится, либо исследуя, либо эксплуатируя в данной среде переход от одного состояния к другому, от одного действия к другому, максимизируя долгосрочное вознаграждение. На изображении ниже в игре Марио агент Марио в среде игрового уровня выполняет различные действия и приводит к новому состоянию и награде. Используя итеративный подход для максимизации долгосрочного вознаграждения, агенты успешно завершат уровень.

Примеры:

Такие игры, как шахматы, покер, альпа-гоу. Таргетинг рекламы.

источник изображения

Ссылки

Машинное обучение: https://github.com/rasbt/stat479-machine-learning-fs19/blob/master/01_overview/01-ml-overview__notes.pdf

Контролируемое обучение: https://medium.com/@citronhub/supervised-learning-bc06002d5df

Введение в машинное обучение для начинающих: https://medium.com/@citronhub/supervised-learning-bc06002d5df

Краткое введение в обучение с подкреплением: https://medium.com/free-code-camp/a-brief-introduction-to-reinforcement-learning-7799af5840db