Переобучение в машинном обучении

Какова основная цель построения модели машинного обучения?

Насколько нам известно, модели машинного обучения созданы для прогнозирования результата на основе ранее не встречавшихся данных. Особое внимание следует уделять данным «никогда ранее», поскольку новизна модели машинного обучения и ее адаптивность к решению конкретных бизнес-кейсов будут оцениваться на основе ее эффективности на совершенно новом наборе данных.

Обеспечение того, чтобы модель хорошо обобщала «Обобщение» на тестовом наборе, включает в себя повторную настройку архитектуры модели, слоев и т. д. в процессе, который называется «Оптимизация», и часто модель изучает слишком много информации и, таким образом, переполняет все возможные сценарии данные обучения; ситуация, которая определяется как переобучение.

Когда модель машинного обучения превосходит обучающие данные, ее производительность в новом наборе данных будет ниже, чем в обучающих данных, что противоречит цели, ради которой создается модель машинного обучения.

Понимание переобучения

Чтобы понять переобучение на языке непрофессионала, давайте предположим, что нам поручено построить модель CNN, которая отличает грузовик от автомобиля. Для этой задачи нам даны два (2) набора данных, по одному для грузовых и легковых автомобилей для обучения модели, см. рисунок 1 ниже.

После обучения мы решили оценить производительность нашей модели на тестовом наборе данных ниже.

Рис. 2 Тестовый набор

Мы все видим, что на рис. 2 выше изображен автомобиль, однако по оценке, скажем, модель классифицирует его как грузовик; Это означает, что модель изучила и соответствует всем характеристикам грузовика в нашем наборе обучающих данных, включая «красный» цвет грузовика; поэтому в глазах нашей недавно обученной модели все автомобили красного цвета являются грузовиками.

Таким образом, наша модель превысила тренировочный набор.

Что такое переобучение

Таким образом, переоснащение в машинном обучении — это ситуация, когда модель изучает все атрибуты обучающих данных и отлично работает с ними, но не может восстановить свою точность на тестовом наборе.

Причины переобучения

Переобучение в основном является результатом небольшого количества доступных обучающих данных, включая другие;

Модель обучения слишком долго на одном и том же наборе выборок
Слишком много выбросов присутствует

Как обнаружить переобучение

Возможно, нет лучшего способа определить, имеет ли модель машинного обучения переобучение, чем оценить ее на проверочном наборе. Набор проверки представляет собой дробную часть всего набора данных; весь набор данных в начале разработки модели машинного обучения разделяется на обучающий, проверочный и тестовый наборы, и пока модель обучается с использованием обучающего набора, оценка модели выполняется на проверочном наборе, и когда точность модели ужасна ниже, чем у обучающего набора, то мы говорим, что существует проблема переобучения.

Как предотвратить переоснащение

Снижение веса
Выбывать
Больше данных о тренировках
Функции обратного вызова

Заключение

Переобучение, пожалуй, является наиболее частым явлением в машинном обучении, и на самом деле при построении модели рекомендуется сначала переобучить ее, а затем мы начинаем ее оптимизировать до тех пор, пока не будет получена модель, которая будет значительно хороша при проверке и тестовом наборе. Пытаясь совместить обобщение и оптимизацию, которые являются двумя фундаментальными проблемами машинного обучения, мы неизбежно переобучаемся или даже недостаточно подбираемся, и знание причин и возможных методов решения этой проблемы важно для построения масштабируемой модели машинного обучения и именно того, что предназначено в этой статье. о достижении.