Машинное обучение для обезьян 🐵 — Часть 0x01

Здесь я представляю концепцию автоматизированного обучения, обучения по индукции и других методов обучения.

Эта статья является частью серии статей о фундаментальных теориях машинного обучения.

Что такое обучение?

Чтобы создать системы, способные учиться автономно, мы должны понять, что такое обучение. Обучение – это, по сути, способность превращать опыт в опыт или знания. Например, ребенок в какой-то момент может не знать, как различать голоса членов семьи, но по мере того, как он взаимодействует с ними и слышит каждый из их голосов в сопровождении их лиц, он постепенно учится определять голос каждого члена семьи и после через несколько месяцев он становится экспертом в распознавании голосов каждого члена семьи. В контексте примера с ребенком, как мы называем входные данные, которые он получает, и что будет на выходе? Входные данные, которые получает мозг младенцев, мы называем данными для обучения, которые представляют собой опыт, а на выходе будет некоторый экспертиза. Что же тогда представляет собой опыт, который приобрел ребенок?В этом случае опыт, который приобрел ребенок, — это способность распознавать голос каждого члена семьи.

Поскольку мы ищем формальное математическое понимание этой концепции, мы должны задать себе следующие вопросы: какие обучающие данные потребуются нашей обучающей системе? Как можно автоматизировать обучение? Как мы можем оценить успех или неудачу такой системы?

Математическая дилемма обезьяны

Давайте рассмотрим пример обучения, проанализировав двух вымышленных обезьян по имени A и B соответственно, которые проходят онлайн-курс по алгебре. A и B учатся совершенно по-разному. Обезьянам A и B показываются 100 уравнений, подобных приведенным ниже:

Им не дают никаких объяснений, как решать уравнения, и они никогда раньше не посещали уроки математики. Им дается 1 час, чтобы найти стратегию, которую они должны использовать для решения уравнений в тесте, который они получат по прошествии этого 1 часа.

Обезьяна А решает запомнить все уравнения, Обезьяна Б анализирует уравнения и пытается найти закономерности в уравнениях. Кто из обезьян, скорее всего, решит их правильно, получив тест с уравнениями, которых они никогда раньше не видели? Очевидно, это Monkey B!

Какие стратегии использовали Обезьяны для обучения? Почему Monkey B работает лучше, чем A? Что ж, Обезьяна А использовала технику, называемую «обучение путем запоминания», а Обезьяна Б использовала «индуктивное рассуждение», также называемое «индуктивным выводом». Индуктивное рассуждение — это когнитивный процесс наблюдений, выявления закономерностей с целью обобщений. Отличительной чертой успешной системы обучения является способность перейти от нескольких примеров к более широким обобщениям.

Отлично, мы знаем, что индуктивное рассуждение является отличительной чертой успешной системы обучения, но будет ли оно последовательным в предоставлении нам правильных выводов?

Поищем этот ответ на примере индуктивного рассуждения: «У меня есть сумка, я засовываю руки в сумку и достаю банан, снова опускаю руки в сумку и выходит другой банан, я кладу мои руки снова в сумке, и из нее вылезает еще один банан. В моей сумке только бананы». Вы заметили, что это соответствует нашему предыдущему определению индуктивного рассуждения? (Наблюдайте, выявляйте закономерности и делайте обобщения) Разумно ли делать вывод, что все, что находится в мешке, является бананом только потому, что мы наблюдали, как из него выпало 10 бананов? Разумно ли заключить, что в каждом мешке будут бананы? Вы можете ответить в любом случае, но если мы хотим создать хорошие системы обучения, мы должны формально доказать, что нам удастся последовательно делать верные выводы. К сожалению, ясно, что индуктивное рассуждение не будет последовательным и, таким образом, приведет к ложным выводам.

Вернемся к математической дилемме обезьяны, когда обезьяна Б использовала индуктивное мышление для решения уравнений. Понятно, что его метод обучения превосходит метод Обезьяны А, но, как мы пришли к выводу выше, он не будет последовательным, чтобы всегда возвращать верные выводы. Поэтому у нас есть два варианта: либо полностью удалить метод индуктивных рассуждений, либо внести в него некоторую модификацию, чтобы улучшить его способность к обучению. Мы могли бы фактически позволить Обезьяне B лучше справляться с тестом, предоставив Обезьяне B некоторые предварительные знания о терминах, переменных, выражениях, уравнениях и шаблонах, которые она должна игнорировать, а также о шаблонах, на которые она должна обращать внимание. Включение предварительных знаний, которые влияют на процесс обучения Monkey B, называется индуктивным искажением. Обезьяна B теперь будет предвзято обнаруживать определенные закономерности в уравнениях, игнорируя другие. Оказывается, включение предварительных знаний является одним из ключевых понятий, которые необходимо понять для построения успешной системы обучения, и мы углубимся в эти понятия в последующих статьях.

Когда нам нужно машинное обучение?

Машинное обучение часто используется для решения следующих классов задач:

Когда у нас есть задачи, которые чрезвычайно сложно кодировать вручную, например: обнаружение рукописных цифр, обнаружение лиц на изображениях и обработка естественного языка. Слишком сложно создать четкое пошаговое решение таких проблем.

Когда нам нужны программы, которые адаптируются к изменениям или среде:например, механизмы рекомендаций, которые адаптируются к предпочтениям пользователей, системы распознавания речи, которые адаптируются к изменениям в голосе пользователей, и программы, которые адаптируются к изменениям в почерке.

Какие существуют методы обучения?

Обучение под наблюдением. Это метод обучения, при котором учитель помогает обучать учащегося, предоставляя правильные метки для данных. Эти данные называются обучающими данными или обучающим набором данных. Например, допустим, у нас есть набор бананов B = {b1, b2, b3, b4}. Затем учитель давал правильные ярлыки для каждого элемента набора бананов, ярлыки = {спелый, неспелый, спелый, спелый}. Этот процесс маркировки похож на предоставление нашей Обезьяне предварительных знаний, чтобы она могла успешно выполнить задачу, которую ей поручили изучить.

Формально эти обучающие данные обычно представляют собой некоторый N-мерный вектор, который будет вводиться в систему обучения, использующую вывод для маркировки невидимых данных. Таким образом, учитель направляет ученика в его учебной задаче.

Эти типы методов обучения разделены на задачи классификации и регрессии, а позже мы углубимся в особенности такого рода проблемы.

Обучение без присмотра. Немного отличается от предыдущего метода, так как учащемуся не предоставляются правильные ярлыки и нет учителя, который бы направлял его. Примеры этого типа обучения распространены среди людей, людям не нужны ярлыки, чтобы учиться. Знаете ли вы ребенка, которому давали ярлыки, чтобы научиться узнавать лицо или голос матери? Эти системы обучения разделены на задачи кластеризации и ассоциации.

Подкрепление и полуконтролируемое обучение — это методы, которые используются в различных системах обучения и будут обсуждаться в следующих статьях.

Как машинное обучение связано с другими областями?

Машинное обучение имеет общие корни со статистикой, теорией информации, теорией игр и оптимизацией (исчисление). Это подобласть компьютерных наук, поскольку наша цель здесь — программировать машины, которые будут обучаться. Это также ветвь искусственного интеллекта, однако обратите внимание, что целью машинного обучения является не создание автоматизированной имитации разумного поведения людей, а скорее использование возможностей компьютеров для дополнения человеческого интеллекта. В отличие от людей, компьютеры могут анализировать миллиарды терабайт данных, о которых мы и мечтать не можем. Они также могут выполнять очень сложные вычисления на порядок быстрее, чем наш биологический мозг. Использование этих возможностей для улучшения нашего общества и нашего собственного интеллекта — это только здравый смысл.

В следующей статье: мы познакомимся со статистической моделью обучения и другими концепциями, которые станут основой для полного понимания этих автоматизированных систем обучения.

Если вам понравилось ❤❤️️ читать это, не забудьте подписаться и 👏! Поделитесь им с друзьями, семьей и всеми обезьянами, которых вы знаете! Здоровья!!😄 🐵

Машинное обучение для обезьян 🐵 — Часть 0x01 — Введение

Что такое обучение?

Математическая дилемма обезьяны

Когда нам нужно машинное обучение?

Какие существуют методы обучения?

Как машинное обучение связано с другими областями?

Похожие вопросы