Обзор

В одной из своих первых статей для Medium я писал о том, что нахожусь в пути изучения науки о данных. Я описал путь, на котором первой вехой стал сертификат IBM Data Science Professional.

Наконец, я прошел через это и получил сертификат [вставьте сюда фанфары самовосхваления]. Я нашел курс очень полезным и считаю, что другим он тоже будет полезен. Если вы заинтересованы, пожалуйста, продолжайте и прочитайте мой обзор.

Формат

Платформа онлайн-обучения Coursera размещает сертификат IBM Data Science Professional Certificate в виде самостоятельной и полностью онлайновой последовательности из десяти курсов. Согласно Coursera, курс займет у вас около пяти месяцев, если вы будете заниматься три часа или меньше в неделю. Я сделал это быстрее и подробнее напишу об этом в конце этой статьи.

Первые семь дней курса бесплатны при регистрации. После этого стоимость будет составлять 31 фунт стерлингов (39 долларов США) в месяц в зависимости от модели подписки. Это в сумме составляет 155 фунтов стерлингов (159 долларов США), если вам действительно нужно пять месяцев, чтобы пройти курс, что, на мой взгляд, по-прежнему является очень хорошим соотношением цены и качества.

Контент

Сертификат включает в себя десять отдельных курсов. Большинство курсов содержат видео, викторины и работу с кодом в чередующемся порядке. Coursera будет отмечать вас в викторинах, а ваши коллеги будут отмечать вас за созданные вами артефакты; это может быть код или презентации.

Я получил наибольшую пользу от работы с кодом, так как это помогло материалу лучше усвоиться. Курсы дают много возможностей попрактиковаться в кодировании, которые, однако, не оцениваются. Формально это не имело бы значения, если бы я не выполнил большую часть работы по кодированию. Тем не менее, я настоятельно рекомендую выполнять всю работу по кодированию добровольно, чтобы получить максимальную отдачу от курсов. Видео иногда бывают очень короткими, и если вы еще не знаете какой-либо концепции, вам будет сложно запомнить и применить ее, просто посмотрев видео один раз.

Один из первых курсов научит вас делиться кодом и презентациями, которые вы собираетесь создавать, на GitHub. Если вы планируете использовать эту сертификацию в заявке на роль специалиста по данным или аналогичной работе, и пока у вас мало что можно показать, это может предоставить вам хорошую возможность укрепить свое портфолио.

Список курсов

  1. Что такое наука о данных?
  2. Инструменты для науки о данных
  3. Методология науки о данных
  4. Python для науки о данных, искусственного интеллекта и разработки
  5. Проект Python для науки о данных
  6. Базы данных и SQL для науки о данных с Python
  7. Анализ данных с помощью Python
  8. Визуализация данных с помощью Python
  9. Машинное обучение с Python
  10. Краеугольный камень прикладной науки о данных

Позвольте мне кратко изложить содержание этих курсов.

Что такое наука о данных?

Вы узнаете, что такое наука о данных, чем занимаются специалисты по данным и какие пути карьерного роста существуют для специалистов по данным.

Инструменты для науки о данных

Этот курс дает общий обзор различных инструментов, которые используют специалисты по данным. Вы будете работать над очень простыми фрагментами кода и создадите блокнот Jupyter.

Методология науки о данных

Вы узнаете, как решить бизнес-проблему с помощью науки о данных, как спроектировать, внедрить и развернуть модель, а также как структурировать свои выводы в отчете.

Python для науки о данных, искусственного интеллекта и разработки

Это базовый курс Python, который проведет вас от абсолютного новичка до уровня, который позволит вам писать простые программы и самостоятельно использовать самые популярные пакеты Python. Однако это не сделает вас знатоком Python.

Проект Python для науки о данных

В этом курсе вы используете то, чему научились в предыдущем, и применяете это к реальной проблеме. Методы, которые вы будете использовать, включают веб-скрапинг и извлечение данных из API, а также визуализацию и создание информационных панелей.

Базы данных и SQL для науки о данных с Python

Вы научитесь писать SQL-запросы и включать их в код Python. Однако этот курс не углубляется в базы данных, и для этого на Coursera есть другие специализации.

Визуализация данных с помощью Python

Вы узнаете, как визуализировать данные в Python. Начиная с базовых линейных и гистограмм, вы перейдете к точкам данных на картах и ​​построите интерактивные графики. Вы будете применять следующие пакеты: Matplotlib, Seaborn, Folium, Plotly и Dash.

Машинное обучение с Python

Этот курс представляет собой введение в машинное обучение и обучает основным процессам и алгоритмам машинного обучения с использованием пакетов SciPy и Scikit-learn. Вы узнаете о линейной и нелинейной регрессии, k-ближайшем соседе, логистической регрессии, деревьях решений и т. д.

Краеугольный камень прикладной науки о данных

На последнем курсе для сертификата вы будете работать над более крупным проектом, где вам нужно будет применить то, что вы узнали на предыдущих курсах. Этот курс делает упор на визуализацию данных и применение моделей машинного обучения. В конце ваши коллеги отметят вас на большой презентации, которую вы создадите с вашими выводами.

Мой вердикт

Я начал этот курс с глубоким пониманием статистики и некоторыми базовыми знаниями SQL и Python. Однако несколько пакетов Python, использованных в курсе, были для меня новыми.

Мне очень понравилось, что курсы были очень практичными и включали много практических занятий по программированию. Именно в этом было мое слабое место, и это помогло мне отточить основы Python, такие как списки и кортежи, поиск данных во фреймах данных Pandas и т. д.

Курс был легким в теоретической части. Я мало что узнал о математических или статистических основах алгоритмов машинного обучения и до сих пор не могу реализовать их с нуля. Я просто научился эффективно использовать пакеты машинного обучения, но это уже ценный навык, и я не мог этого раньше.

Я мог закончить курс примерно за 2–3 месяца, занимаясь по несколько часов в неделю. Конечно, помогло то, что у меня были базовые знания Python и SQL, что делало некоторые курсы относительно легкими. Однако, если вы начинаете без предварительных знаний и действительно хотите углубиться, то предлагаемое Coursera требование о трех часах в неделю в течение пяти месяцев кажется разумным.

Следующие шаги и итоги

Курс того стоил, и я уже мог применить свои улучшенные навыки Python и знания в области науки о данных. В следующий раз я планирую пройти курс Специализация машинного обучения Эндрю Нг.

Я настоятельно рекомендую сертификат IBM Data Science Professional Certificate, если вы хотите заняться наукой о данных в качестве карьеры, но вам все еще нужно отточить основы. Я также рекомендую этот курс, когда вы просто хотите понять основы науки о данных, работая в другой области. Это поможет вам более эффективно разговаривать с коллегами по науке о данных и даст вам представление о том, как они видят вашу проблему. Это может быть наиболее важным преимуществом этого курса для многих людей.

Если вам понравилась эта статья, пожалуйста, подпишитесь на меня на Medium, подпишитесь на меня в Twitter или войдите в мой список адресов электронной почты.…