Потребность в этом новом мире

Изучение искусственного интеллекта, разработка разумной машины для решения конкретной задачи — это культ, популярность которого постоянно растет. Мы изучаем новые области применения этих открытых и разработанных методов искусственного интеллекта, и это исследование само по себе является совершенно новым миром. На данный момент мы можем сказать, что этот мир не наивен и не ограничен с точки зрения возможностей, исследования, применения, обсуждения или даже дисциплин. Искусственный интеллект обладает огромной силой и потенциалом для применения в самых разных областях, от кинематографа до аэрокосмической отрасли, от научных открытий до продуктов и услуг, которые нам нужны каждый день.

Это не то путешествие, в котором у нас есть дороги, чтобы исследовать известное, это путешествие, в котором мы должны найти путь к неизвестному. Чтобы исследовать это неизвестное, у нас есть инструменты настоящего, известного. Один очевидный вопрос: если у нас есть известные инструменты настоящего, зачем нам исследовать это неизвестное? Почему мы должны искать новые пути, новые места, новые миры и новые возможности? Ответ на этот вопрос заключается в том, что наших нынешних знаний и существующих инструментов недостаточно для решения всех наших проблем.

Искусственный интеллект решает свои внутренние проблемы и помогает нам справляться с различными проблемами реального мира.

Является ли искусственный интеллект аутсайдером или он полностью раскрыл свой потенциал? Если искусственный интеллект силен, то насколько и что делает его сильнее?

Солнце этого нового мира

Если искусственный интеллект — это совершенно новый мир, то нейронные сети — это солнце этого мира. Сильная сила, питающая всю планету искусственного интеллекта. Мы можем думать о нейронных сетях как о мыслительном механизме, у которого, как и у любого другого механизма, есть свои механизмы. Этот механизм пытается учиться на заданных данных. Учиться на данных значит понимать данные. Учиться — значит улучшать свое понимание этих данных в итерациях. Об успешности такого обучения нейронной сети судят по ее способности предсказывать оптимальные ответы на вопросы, которые сеть не задавала в процессе обучения и эти новые вопросы связаны с вопросами, на которых машина обучалась. Если эта нейронная сеть хорошо научилась, то у нее есть прошлые данные, чтобы ответить на эти новые вопросы.

Валюта этой новой планеты

Данные действительно являются валютой искусственного интеллекта. Наборы данных — это записи событий, которые влияют на результат того действия или шага, который сеть должна предпринять для решения проблемы. Давайте просто рассмотрим проблему беспилотных автомобилей. Какие события влияют на исход вождения? Мы, люди, руководствуемся нашим прошлым опытом и нашей способностью видеть и наблюдать физический мир вокруг нас. Эта способность помогает нам принимать решения, например, когда остановить машину, когда снизить скорость, когда обгонять, а когда нет. Вождение автомобиля имеет два аспекта: один — это способность человека видеть своими глазами, а другой — приобретенный опыт, который анализирует сцену и принимает оптимальное решение. Теперь, чтобы искусственный интеллект научился водить машину, он должен научиться анализировать сцену и понимать, как управлять автомобилем, из видеороликов о вождении человека. Коллекция видеороликов о вождении автомобиля людьми будет набором данных этой проблемы для нейронной сети.

Нейронные сети работают с наборами данных, которые имеют некоторую корреляцию между входными и выходными данными. Если это условие корреляции между его входом и выходом верно, то в этих данных всегда есть некоторые шаблоны, и если они известны, мы можем легко предсказать результат даже для входов, для которых выходы неизвестны. Нейронные сети используют это же свойство. Нейронные сети пытаются найти корреляцию между входами и выходами. Они пытаются сопоставить ввод и вывод с помощью математической функции. Если нейронные сети находят правильную функцию, то они всегда могут быть правы в данной проблеме, какой бы непредсказуемой она ни казалась человеческому разуму.

Любые данные имеют несколько переменных, например, в видео о вождении автомобиля одна переменная — это дорога, другая — дорожные препятствия, дорожные знаки и т. д. Чтобы правильно проанализировать сцену, машине необходимо различать эти переменные и классифицировать их по категориям.

Данные в целом делятся на 2 категории. Во-первых, это линейно разделимые данные, данные, которые можно разделить с помощью прямой линии. Этот тип набора данных представляет собой довольно простой набор данных без какой-либо сложности. Допустим, у нас есть данные об оценках учеников по одной оси и у нас есть зачет или провал по другой оси, мы можем четко провести линию на графике, которая разделит неудовлетворенных и неудовлетворенных учащихся. Используя эту линию, мы можем четко классифицировать данные. Вторая категория — нелинейно разделимые данные. Данные не могут быть разделены прямой линией. Это сложный набор данных. Наш набор данных о беспилотных автомобилях относится к этой категории.

Сила солнца

Искусственная нейронная сеть — это математическая функция, которая принимает некоторый ввод и возвращает результат. Эта математическая функция имеет множество отдельных математических единиц, называемых нейронами. Разные нейроны связаны друг с другом с разной силой связи (весом), чем больше сила, тем сильнее прохождение сигнала от одного нейрона к другому. Нейронная сеть состоит из 3 основных компонентов: один из них — входной слой, входной слой — это часть нейронной сети, отвечающая за прием входных данных. Последний раздел нейронной сети — это выходной слой, слой, который возвращает выходные данные. Между ними есть скрытые слои. Нейронные сети учатся выполнять ту или иную задачу в процессе обучения. В процессе обучения мы даем нейронным сетям ввод, и они возвращают вывод, и мы оцениваем точность вывода сети, сравнивая его с ожидаемым выводом. Если выходные данные сети неточны, мы измеряем неточность и сообщаем сети об этой неточности. Сети настраивают свои внутренние параметры (эти математические функции) в соответствии с неточностью, и к концу процесса она учится выполнять эту задачу с желаемой точностью.

Если нейронные сети способны на это, они могут научиться выполнять любую задачу с заданным набором данных. Тогда реальность сильнее любого научно-фантастического воображения/предсказания. Теоретически это так, но на практике это не так. Но почему, какие проблемы мешают нам сделать это, используя весь потенциал теории нейронных сетей?

Теперь самое время вернуться к вопросу, который мы задавали ранее, насколько мощна нейронная сеть? Прежде чем ответить на этот вопрос, позвольте мне переформулировать вопрос: когда произойдет конвергенция сети? Когда сеть найдет желаемый выход для заданного входа? В случае линейно разделимых данных ответ прост. Правило персептрона гласит, что для линейно разделимой сети данных без каких-либо скрытых слоев можно найти оптимальные параметры, которые могут точно предсказать вывод для всех входов. По любым линейным данным нейронные сети без каких-либо скрытых слоев могут научиться предсказывать данные с желаемой точностью.

Но как насчет нелинейно разделимых данных? Для нелинейно разделимых данных у нас есть дельта-правило, которое пытается найти оптимальные параметры для сети в заданных нелинейно разделимых наборах данных.

В реальном мире у нас есть линейно разделимые и нелинейно разделимые данные, мы знаем, какие типы нейронных сетей сходятся на линейно разделимых данных и для нелинейно разделимых данных. Таким образом, для выполнения нейронной сетью заданной задачи нам нужен набор данных, описывающий задачу, решающий, что будет входом в сеть и какие результаты мы ожидаем, и у нас есть действительно мощный инструмент, который учится выполнять эту задачу.

Это будет серия блогов, в которых я буду обсуждать нейронные сети. Я пытаюсь начать с интуиции, релевантности реального мира, основных вопросов, механизма и теории этой темы, так что следите за обновлениями. Подпишитесь на мою рассылку, чтобы не пропустить ни одного блога