Этот пост является частью Месяца до мастера, 12-месячного проекта ускоренного обучения. На май моя цель — создать программную часть беспилотного автомобиля.

Вчера я начал обучать модель беспилотного автомобиля на базе большого набора данных Udacity.

Значение Loss (показатель, косвенно пропорциональный точности модели) начиналось с 6,14783.

Много часов спустя модель завершила обучение, сократив Loss до 0,000377398.

Вот график Loss во времени:

Это снижение потерь весьма поразительно.

Еще более поразительна разница в потерях при использовании 5000 точек данных (как я сделал несколько дней назад) с потерей ~ 1,00 и при использовании 33 000 точек данных Udacity с потерей около 0,000377398.

Другими словами, увеличив размер набора данных в ~7 раз, потери сократились примерно в 2500 раз. Очевидно, что это не линейная зависимость: с небольшим количеством данных модель становится смехотворно лучше.

И именно поэтому Google может позволить себе раздать все/большую часть своих алгоритмов машинного обучения и библиотек через TensorFlow: количество данных является отличительной чертой, и у Google больше всего (из поиска, электронной почты, фотографий, видео на YouTube и т.

На самом деле, в интересах Google сделать свои алгоритмы открытыми, что позволит большему сообществу разработчиков быстрее улучшать алгоритмы. Затем Google может взять эти улучшенные алгоритмы, предоставить им собственные данные и получить лучшие модели машинного обучения со значительным отрывом.

Сегодняшний день действительно помог мне оценить ценность данных как конкурентного преимущества.

Говоря о данных… Я достиг важной вехи в создании собственного набора данных: сегодня исполняется 200 дней подряд, когда я написал сообщение в блоге в рамках своего проекта Месяц до мастерства.

Мой набор данных ежедневных записей теперь составляет около 85 000 слов. Возможно, когда я закончу со всеми 365 постами, я придумаю что-нибудь интересное, что можно сделать с этим набором данных…

Читайте следующий пост. Читайте предыдущий пост.

Макс Дойч — одержимый ученик, создатель продукта, подопытный кролик Month to Master и основатель Openmind.

Если вы хотите следить за годичным проектом ускоренного обучения Макса, обязательно подпишитесь на эту учетную запись Medium.