Как начать карьеру в Data Science

Если вы попали на эту страницу, значит, вы наверняка встречали такие утверждения, как «Специалисты по анализу данных - самая сексуальная работа 2020 года», «Наука о данных - одна из самых высокооплачиваемых должностей» и т. Д. Насколько правдивы эти предложения, или это просто для того, чтобы вызвать у нас ажиотаж? По мнению работающих профессионалов и рекрутеров, наука о данных может оказаться отличной карьерой, но большинству самопровозглашенных специалистов по обработке данных не хватает столь необходимых навыков.

В этой статье будет представлена ​​дорожная карта, с которой вы сможете начать свои усилия в области науки о данных и преуспеть в этом. Я постараюсь предоставить все необходимые навыки и ссылки на несколько МООК для их изучения.

  1. Выберите правильный язык. Для начала вам нужно выбрать язык программирования. Python и R - самые востребованные языки для специалистов по данным. Python более предпочтителен, чем R, поскольку у него большое сообщество, а также из-за наличия многих встроенных библиотек. На Youtube, Udemy или Coursera доступно множество онлайн-курсов для изучения этих языков. Одна вещь, на которой я хочу, чтобы вы все сосредоточились, - это писать заметки во время просмотра обучающих видео. Это будет большим подспорьем перед любым собеседованием, которое нужно пересмотреть за короткий период времени. Вам не нужно быть конкурентоспособным программистом, но вы должны уметь писать коды.
  2. Не недооценивайте статистику. Большинство учащихся пропускают эту часть пути, о которой они сожалеют, во второй части поиска работы. Наука о данных - это смесь математики и компьютерного программирования. Вы можете обратиться к специальному курсу Статистика с питоном, предлагаемому Мичиганским университетом на Coursera. Вы можете бесплатно просмотреть обучающие видеоролики любого курса на Coursera, выбрав опцию Проверить этот курс.
  3. Начать анализ данных. Анализ данных дает понимание или, можно сказать, скрытые закономерности в необработанных данных. Вам нужно научиться читать, управлять и очищать файлы данных с помощью различных библиотек Python, таких как pandas и numpy. Введение в науку о данных в Python, предлагаемое на Coursera, станет хорошим источником для этого обучения. После этого мы должны сосредоточиться на визуализации и создании диаграмм. Прикладное построение графиков, диаграмм и представление данных на Python - этот курс также от Coursera.
  4. Машинное обучение. Это самая важная и интересная часть пути. В Интернете доступно множество курсов, я обнаружил, что Машинное обучение от А до Я на Udemy - один из лучших курсов для новичков, которые хотят понять все в машинном обучении. Помимо этого, Google выполняет поиск по каждому алгоритму и внимательно просматривает все эти статьи и, как было сказано ранее, готовьте заметки для каждого алгоритма, описанного в этом руководстве. Не пропускайте математическую часть машинного обучения, постарайтесь разобраться в каждом алгоритме с нуля.
  5. Погрузитесь в глубокое обучение. Глубокое обучение - это новая область исследований в области машинного обучения, которая была введена для того, чтобы приблизить машинное обучение к одной из его первоначальных целей: искусственному интеллекту. Инженеры глубокого обучения пользуются большим спросом, и освоение глубокого обучения откроет вам множество новых возможностей для карьерного роста. Глубокое обучение - это также новая сверхдержава, которая позволит вам создавать системы искусственного интеллекта, которые были невозможны несколько лет назад. Deep Learning Specialization Эндрю Нг, несомненно, лучший курс, доступный в Интернете. Вы также можете обратиться к этому репозиторию Github за важными замечаниями по этой специализации.
  6. Развертывание модели. До сих пор вы должны были четко понимать, как создавать впечатляющие модели машинного обучения и как использовать эти прогнозы. Но никого не интересуют ваши коды, им нужен только результат. Чтобы начать использовать модель для принятия практических решений, ее необходимо эффективно внедрить в производство. Если вы не можете достоверно получить практическое представление о своей модели, то влияние модели сильно ограничено. Вы можете изучить REST API и другие методы развертывания из различных плейлистов YouTube.
  7. Проекты и хакатоны: до сих пор у нас была только теория, и мы не использовали наши знания в практических и экспериментальных целях. Чтобы создать красивое резюме и GitHub, вы должны работать над несколькими сквозными проектами и участвовать в как можно большем количестве хакатонов, доступных на AnalyticsVidhya, Machinehack, Zindi и многих других. Создайте профиль на Kaggle, участвуйте в соревнованиях Kaggle, учитесь на других кодах и реализуйте их самостоятельно.

Теперь вы готовы к успеху в области науки о данных. С наилучшими пожеланиями !!