Самостоятельное обучение приближает нас к автономному обучению

Самостоятельное обучение привлекает внимание, потому что оно может решить значительное ограничение машинного обучения с учителем, а именно. требуется множество внешних обучающих выборок или контрольных данных, состоящих из входов и соответствующих выходов. Ян ЛеКуну недавно в интервью журналу Science and Future Magazine представил самостоятельное обучение как серьезную проблему ИИ на следующее десятилетие.

Люди, например, могут определить семантическое значение слова апельсин из контекста, когда оно появляется рядом с футболкой, холодильником, округом или мобильным телефоном. Точно так же в машинном обучении алгоритм Word2Vec предсказывает семантический контекст слова на основе окружающих слов. Исследования, лежащие в основе обучения с самоконтролем, основаны на том же принципе автоматического определения, извлечения и использования контролирующих сигналов.

Что такое самостоятельное обучение?

Самостоятельное обучение - это автономное обучение с учителем. Это подход к репрезентативному обучению, который устраняет предварительное условие, требующее от людей маркировать данные. Системы обучения с самоконтролем извлекают и используют естественно доступный релевантный контекст и встроенные метаданные в качестве контрольных сигналов.

Кошки по-прежнему играют важную роль во всем, что связано с машинным обучением. Самоконтролируемое исследование Обучение визуальному представлению без учителя с помощью предсказания контекста предсказывает позиционное положение одного прямоугольного участка изображения относительно другого с использованием пространственного контекста в качестве контрольного сигнала для тренировки богатого визуального представления. Например, правое ухо кошки будет в верхнем правом положении по отношению к глазам кошки. Этот подход позволяет узнать о кошках, собаках или автобусах без предварительной явной семантической маркировки.

К счастью, самостоятельное обучение не ограничивается обучением на основе визуальных сигналов или связанных метаданных в изображениях или видеороликах кошек и имеет варианты использования, выходящие за рамки компьютерного зрения.

Самоконтроль против обучения с учителем

Самоконтролируемое обучение - это контролируемое обучение, потому что его цель - изучить функцию из пар входов и помеченных выходов. Явное использование помеченных пар ввода-вывода в обучении с учителем не требуется. Вместо этого корреляции, встроенные метаданные или знания предметной области, доступные во входных данных, неявно и автономно извлекаются из данных и используются в качестве контрольных сигналов. Как и обучение с учителем, обучение с учителем имеет варианты использования в регрессии и классификации.

Самоконтроль против обучения без учителя

Самостоятельное обучение похоже на обучение без учителя, потому что система учится без использования явно предоставленных меток. Это отличается от обучения без учителя, потому что мы не изучаем внутреннюю структуру данных. Самоконтролируемое обучение, в отличие от неконтролируемого обучения, не сосредоточено на кластеризации и группировке, уменьшении размерности, механизмах рекомендаций, оценке плотности или обнаружении аномалий.

Самоконтролируемое и полу-контролируемое обучение

Комбинация помеченных и немаркированных данных используется для обучения полууправляемых алгоритмов обучения, где меньшие объемы помеченных данных в сочетании с большими объемами немаркированных данных могут ускорить задачи обучения. Самостоятельное обучение отличается, поскольку системы обучаются полностью без использования явно предоставленных ярлыков.

Почему обучение с самоконтролем актуально?

Самостоятельное обучение важно по многим причинам, но в основном из-за недостатков как в подходе, так и в масштабируемости обучения с учителем.

Обучение с учителем - сложный процесс, требующий сбора огромных объемов данных, их очистки, маркировки вручную, обучения и совершенствования модели, специально созданной для варианта использования классификации или регрессии, который вы решаете, а затем использования ее для прогнозирования меток для неизвестные данные. Например, с изображениями мы собираем большой набор данных изображения, маркируем объекты на изображениях вручную, изучаем сеть и затем используем ее для одного конкретного случая использования. Этот способ сильно отличается от подхода к обучению людей.

Человеческое обучение основано на испытаниях, непрерывно, осуществляется из нескольких источников и выполняется одновременно для нескольких задач. Мы учимся в основном без присмотра, используя эксперименты и любопытство. Мы также учимся под наблюдением, но мы можем учиться на гораздо меньшем количестве образцов, и мы исключительно хорошо обобщаем.

Для обучения с учителем мы потратили годы на сбор и профессиональное аннотирование десятков миллионов помеченных ограничивающих прямоугольников или многоугольников и аннотаций на уровне изображений, но эти наборы данных Открытые изображения, Классы визуальных объектов PASCAL, Image Net и Microsoft COCO »Вместе бледнеют по сравнению с миллиардами изображений, ежедневно генерируемых в социальных сетях, или миллионами видео, требующими обнаружения объектов или восприятия глубины при автономном вождении. Подобные аргументы масштабируемости существуют в пользу здравого смысла.

Самостоятельное обучение с подкреплением

Дрессировщик может вознаградить собаку за позитивное поведение и наказать за негативное. Со временем собака выясняет и учится действиям, которые необходимо предпринять, чтобы получить награду. Точно так же в обучении с подкреплением навигационный робот учится перемещаться по курсу, когда его награждают за то, что он остается на курсе, и наказывают, когда он сталкивается с чем-то в окружающей среде. В обоих случаях эта обратная связь с вознаграждением и наказанием усиливает, какие действия следует выполнять, а каких следует избегать. Обучение с подкреплением хорошо работает при наличии системы обратной связи для вознаграждения. Это также требует исчерпывающего набора обучающих данных и может оказаться непрактичным с учетом затрат, времени и количества итераций, необходимых для успешного выполнения.

В отсутствие системы обратной связи, основанной на вознаграждении, собака или навигационный робот могут учиться самостоятельно, любопытно исследуя окружающую среду. Исследователи из BAIR² создали Модель внутреннего любопытства - систему обучения с подкреплением под самоконтролем, которая может работать даже при отсутствии явной обратной связи. Он использует любопытство как естественный сигнал вознаграждения, позволяющий агенту исследовать свое окружение и изучать навыки для использования в дальнейшей жизни. См. Исследования по адресу: Исследование, основанное на любопытстве, путем самостоятельного предсказания и сопутствующее описание.

Самоконтролируемые обучающие машины могут предсказывать естественную эволюцию и последствия своих действий, подобно тому, как новорожденные могут усвоить невероятные объемы информации в первые недели / месяцы жизни, наблюдая, проявляя любопытство. Самостоятельное обучение имеет потенциал для масштабирования обучения до уровней, необходимых для новых вариантов использования, включая, помимо прочего, варианты использования в медицине, автономном вождении, робототехнике, понимании языка и распознавании изображений.

Самостоятельное обучение приближает нас к автономному обучению, подобному человеческому.

Самоконтролируемое обучение оказалось успешным в оценке относительной глубины сцены без наблюдения человека с использованием методов сегментации движения для определения относительной глубины на основе геометрических ограничений между полем движения сцены и движением камеры.

В медицине нашло применение роботизированная хирургия и оценка глубины в монокулярной эндоскопии.

При автономном вождении обучение с самоконтролем полезно для оценки неровностей местности при движении по бездорожью. Он имеет вариант использования в завершении глубины с использованием LiDAR и монокулярных камер.

Чтобы ознакомиться с последними примерами использования самостоятельного обучения, воспользуйтесь этой поисковой ссылкой.

¹ Янн ЛеКун - профессор Нью-Йоркского университета, главный научный сотрудник Facebook AI Research (FAIR) и директор по исследованиям AI в Facebook. Июль 2018: https://www.sciencesetavenir.fr/videos/yann-lecun-explique-lintelligence-artificielle-et-ses-defis-a-venir_kzrzpf

² BAIR - Исследование искусственного интеллекта в Беркли: http://bair.berkeley.edu