Машинное обучение - не полагайтесь только на свой университет

Резкий контраст между формальными и онлайн-курсами

Проблема с обучением в университете

Включение машинного обучения в предиктивную аналитику пользуется большим спросом, что обеспечивает предприятиям конкурентное преимущество. На эту горячую тему подписываются студенты со всего мира. Однако формальное представление концепций и методов машинного обучения в университетах может оказаться чрезвычайно сложным для среднего студента.

Во время зимнего обмена студентами в Университете Макгилла я записался на их курс Прикладное машинное обучение. Да, было глупо с моей стороны поступить в аспирантуру! Все началось с внедрения линейной регрессии, как и должно быть, поскольку это самый простой алгоритм машинного обучения. Репетитор проделал большую работу, пытаясь объяснить интуицию, лежащую в основе алгоритма.

Но после введения в алгоритм тонны тяжелой математики последний удар был нанесен: «О, кстати, задание 1 вышло, оно должно быть выполнено через 10 дней, и вам предлагается выполнить его на Python, увидимся на следующей лекции. ”

Как я должен был изучить концепции L2-регуляризации и подгонки моделей регрессии со стохастическим градиентным спуском за 10 дней! Я даже не умел писать код на Python!

Меня уже потрясла вторая лекция, которую я сразу бросил. В этом курсе предполагается солидные базовые знания в области статистики, исчисления, линейной алгебры и программирования. И, конечно же, эти 4 элемента были сразу же представлены в рамках первой вводной лекции.

Не помогает то, что я был одним из многих студентов, которые выучивают и забывают большинство математических понятий во время летних / зимних каникул!

Открытие онлайн-курсов

Не допустив, чтобы небольшая неудача подавила мой интерес к науке о данных, я приступил к поиску в Интернете ресурсов, которые обучают машинному обучению, достаточно дружелюбному для широкой публики, «достаточно заинтересованного». Есть много отличных онлайн-курсов, некоторые из них бесплатные, некоторые платные, некоторые официально сертифицированы. Я выбрал платный маршрут, потому что испытываю неподдельный энтузиазм в инструкторах, которые проводят платные курсы.

Я записался на онлайн-курс Кирилла Еременко Машинное обучение A – Z ™: практическое применение Python и R в науке о данных.

Кирилл проделал совершенно фантастическую работу, обеспечив понятную интуицию во всех алгоритмах, представленных в курсе, понятную даже старшекласснику. Все представленные алгоритмы дополняются сеансом практического программирования с данными, близкими к реальным, которые помогли мне визуализировать и понять их значение.

Мотивированный, я повторно записался на другой курс машинного обучения в моем домашнем университете, и мне стало намного проще, поскольку я заложил свой интуитивный фундамент.

В следующем разделе я хотел бы показать некоторый уровень контраста между тем, что я узнал, и тем, чему учили в моем университете на бакалавриате. Я надеюсь, что эта статья вдохновит тех, кто хочет расширить свое обучение за пределы своих университетов, или работающих профессионалов, которые хотят получить дополнительные знания в области машинного обучения.

Заявление об ограничении ответственности: следующее сравнение ограничивается учебными материалами, предоставленными двумя источниками: моим университетом и курсом Кирилла по машинному обучению. Впредь я приношу свои извинения за предвзятое мнение, представленное в следующей статье, и его не следует воспринимать как общее явление, которое встречается во всех формах формального обучения по сравнению с онлайн-обучением.

Так что же по-другому?

Чтобы проиллюстрировать разницу между формальным обучением и онлайн-курсами, давайте рассмотрим несколько распространенных концепций машинного обучения и посмотрим, как это объясняется в моем университете по сравнению с тем, как к нему подходят курсы Кирилла. Следующий список представляет собой снимок того, что мне сложно понять, когда я учился в университете, но полностью развенчал, когда я смотрел видео Кирилла.

Линейная регрессия

Вот как мой университет пытается объяснить линейную регрессию на своих слайдах лекций:

Для опытных это детская игра. Но любому, кто только начал с некоторого уровня статистики и расчетов, потребуется довольно много времени, чтобы переварить эту информацию, особенно из-за отсутствия хороших визуальных эффектов.

С другой стороны, онлайн-курс сразу же погрузился в бизнес-задачу с пошаговым анимированным объяснением:

Простого 3-минутного видео, объясняющего интуицию, лежащую в основе обычного метода наименьших квадратов, достаточно, чтобы кто-нибудь понял его значение.

Оценка моделей линейной регрессии с использованием статистики R-квадрата

Статистика R-квадрата, также известная как критерий согласия, широко используется при оценке моделей линейной регрессии. Предложение, выделенное красным ниже, прекрасно резюмирует использование статистики R-квадрата:

Однако мне намного легче понять наглядное пособие, представленное в курсе Кирилла:

С точки зрения непрофессионала, статистика R-квадрата - это просто сравнение наиболее подходящей линии с «наихудшей линией», которая представляет собой постоянное среднее значение данных. Чем меньше квадрат остаточной суммы, тем выше значение R-квадрата. Скорректированный R-квадрат добавляет штраф к дополнительным предикторам, которые не имеют отношения к модели, и он применим для моделей множественной линейной регрессии.

Классификатор максимальной маржи опорного вектора

Понимание концепции машин опорных векторов было особенно сложной задачей в моем университетском курсе машинного обучения. Из-за бомбардировки тяжелой математикой казалось невозможным усидеть и понять концепцию за один раз. Взгляните на извлечение информации о классификаторе максимальной маржи ниже:

Теперь, напротив, мы видим красоту того, как простая иллюстрация Кирилла прибивает интуицию классификаторов максимальной маржи:

Хорошо, вы понимаете, я еще могу сделать много сравнений, но избавлю вас от скуки! К настоящему моменту вы можете подумать, что онлайн-обучение принесет вам больше пользы, чем получение формального образования в университете. Но лично я чувствую, что завершение курса машинного обучения в моем университете сделало меня гораздо более трудоспособным, чем просто прохождение курса Кирилла.

Но формальное обучение не может быть НАСТОЛЬКО плохим, верно?

Курс машинного обучения не обходится без финального проекта, над которым нужно работать. Курс Кирилла предоставляет простую для понимания интуицию и примеры кодов как на Python, так и на R, над которыми можно работать и следовать. Завершение его руководств дало мне удовлетворение, что я могу делать прогнозы с помощью арсенала алгоритмов машинного обучения.

Но этого мало.

Важность оцененного финального проекта

Градуированный итоговый проект - это то, что отличает формальное обучение от онлайн-обучения. Нам было поручено разработать задачу машинного обучения на основе общедоступных наборов данных. На следующей блок-схеме показан процесс работы с хорошим проектом машинного обучения, который очень похож на реальное приложение:

Наш практический опыт моделирования общедоступных наборов данных был дополнен консультациями по проекту и поддержкой со стороны профессора и технических специалистов, которые обогатили наше обучение индивидуальным подходом. Во время проекта я был рад, что у меня есть коллекция скриптов машинного обучения из курса Кирилла, готовая к реализации для предварительной обработки данных и моделирования.

Важность привыкания к тяжелой математике

Магия высокопроизводительной модели - от статистических выводов до настройки гиперпараметров - заключается в глубоком понимании сложной математики, стоящей за ней.

Такие вопросы, как: «Какова оптимальная скорость обучения и снижение веса для моей модели ИНС?» и на вопрос «Какое оптимальное количество деревьев требуется для хорошей модели регрессии случайного леса без переобучения?» можно ответить только при наличии достаточного количества математических знаний.

В двух словах

Будь то создание рекомендательных систем для внедрения компьютерного зрения в продукты и услуги с поддержкой ИИ, реализация алгоритмов машинного обучения продолжает расти. Прибыльная индустрия искусственного интеллекта вызвала интерес университетов, которые начали предлагать специализированные степени в области науки о данных. Возьмем, к примеру, недавнее предложение получить степень по науке о данных моего университета.

По мере того, как люди становятся более осведомленными о его спросе, они начинают рисковать неизвестным. Не зная о технических тонкостях идеального сочетания математики и информатики, для среднего студента становится естественным усердие в прохождении курса.

Простота применения методов машинного обучения может быть опровергнута многими доступными онлайн-курсами. К сожалению, суровая правда заключается в том, что вряд ли кого-либо из работодателей волнует, есть ли у вас сертификат онлайн-курса, который практически не признается. Ваша формальная квалификация всегда будет приоритетом для руководителя отдела кадров. Особенно, если руководитель отдела кадров технически не склонен.

Другая суровая правда заключается в том, что большинство объявлений о вакансиях в области науки о данных требует даже наличия высшего образования. Прохождение курса бакалавриата, включающего машинное обучение, уже оказалось проблемой для многих. Но я надеюсь, что эта статья может вдохновить читателей меньше полагаться на формальное образование и знать, что существует множество очень полезных ресурсов, которые дополнят ваше обучение в области науки о данных и машинного обучения.

Если вам интересно понять, что нужно для того, чтобы стать хорошим аналитиком данных, чему, по моему мнению, университеты должны уделять больше внимания, вы можете взглянуть на другую статью, которую я написал здесь:

4 важных вещи, которые университеты должны преподавать о науке о данных / аналитике
От сбора, предварительной обработки и преобразования данных до нетехнической коммуникации - все это всегда важно… towardsdatascience.com

Спасибо, что уделили время, я надеюсь, что эта статья в какой-то мере принесла пользу читателям, не стесняйтесь обращаться ко мне, если у вас есть какие-либо вопросы!