TL;DR: AI/ML = способы поиска закономерностей в данных

LLM снова выдвинули искусственный интеллект (ИИ) и машинное обучение (МО) на передний план технологий. Машинное обучение — это подмножество более широкой категории ИИ. С точки зрения промышленности этот термин часто используется как синоним искусственного интеллекта и больших данных.

Почему? Потому что, в конце концов, существует только три реальных проблемы, связанных с машинным обучением как частью продукта. Одна — алгоритмическая сторона (в нейронных сетях это архитектура). Два — это сторона данных; качество, количество и актуальность данных имеют значение. Третье — это развертывание, обслуживание и эксплуатация.

Фокус отрасли сместился с искусственного интеллекта, основанного на правилах, на искусственный интеллект, основанный на данных, или машинное обучение. Область применения машинного обучения охватывает все программы, которые могут обучаться на основе данных. В кадре, который я выложил выше, сочетаются данные и алгоритмы. Существует множество шаблонных алгоритмов машинного обучения, таких как K-средние, K ближайших соседей или линейная регрессия.

Еще есть нейронные сети. Нейронные сети — это движущая сила машинного обучения. «Алгоритмическая» сторона машинного обучения в настоящее время в основном связана со структурой нейронной сети. На момент написания модели трансформеров доминируют как в языковой, так и в визуальной части машинного обучения.

Как машины учатся на данных?

Существует более или менее два типа машинного обучения: контролируемое и неконтролируемое. Технически, существует также много других типов, включая трансферное обучение, обучение с подкреплением, полуконтролируемое обучение и многое другое. На самом деле все эти методы представляют собой просто разные способы сочетания контролируемого и неконтролируемого обучения.

Обучение с учителем описывает предоставление комбинации ввода-вывода для работы модели машинного обучения. Обучение без учителя означает предоставление модели набора данных и предоставление ей возможности работать в соответствии с формулировкой проблемы и архитектурой.

Вначале все модели инициализируются случайными весами; вы можете думать об этом как о случайном алгоритме или преобразовании. По мере обучения модели эти веса обновляются. Прочтите статью Как построить нейронную сеть с нуля для более глубокого изучения математики.

Поскольку модель обновляет веса по мере обработки данных, в конечном итоге модель «изучает» данные. Для контролируемого обучения модель учится сопоставлять входные данные с выходными данными. При обучении без учителя он находит в данных закономерности, имеющие отношение к рассматриваемой проблеме.

Что все это значит?

Для тех, кто не работает непосредственно над AI/ML, вы можете думать об AI/ML как о любом или всех из следующих элементов, в зависимости от вашего вкуса:

  • Мы не знаем, как данные сопоставляются с выходными данными, но мы использовали машину, чтобы найти существующие закономерности.
  • Мы хотим создать что-то, что может принимать некоторые решения, но не знаем правил принятия этих решений, поэтому мы попросили машину найти некоторые правила, которым нужно следовать. К сожалению, машина не может объяснить нам эти правила.
  • Нам нужно собрать деньги для нашего стартапа и мы хотим оседлать волну (по крайней мере, в 2018–2023 годах это справедливо, посмотрим, что произойдет в дальнейшем).
  • Мы знаем, что в данных есть закономерности, но не знаем, какие они.
  • Мы думаем, что данные должны соответствовать желаемому результату, но мы не знаем, так ли это и как это сделать, поэтому, возможно, программа сможет найти это за нас.