Как я нахожу проекты, которые подходят мне

В погоне за самой сексуальной работой 21 века специалисты по обработке данных часто начинают работу с нереалистичными ожиданиями или заканчивают проектами, которые не соответствуют их карьерным устремлениям. Я определенно попадал в одну и ту же ловушку несколько раз. Возможно, вы тоже пережили нечто подобное.

В начале своей карьеры я часто расстраивался из-за проектов, потому что я хотел делать все это - глубокие научные исследования с одной стороны и работу, ориентированную на клиента, с другой. Работая в разных компаниях, я понял, что проекты DS могут иметь очень разные характеристики в зависимости от компании и типа решаемой проблемы.

За это время я в конце концов пришел к выводу, что могу классифицировать и оценивать типы проектов DS, используя три категории, которые я называю «тремя C»:

  • Научная задача: необходимы передовые методы машинного обучения (ML).
  • Креативное решение проблем: есть большая открытая проблема, у которой нет очевидного решения.
  • Влияние на клиента: есть четкий сценарий использования и производственная инфраструктура. Предоставление анализа или модели напрямую влияет на ценность для клиентов

На самом деле, вы можете выбрать только две C для проекта по науке о данных!

Давайте подробнее рассмотрим, что на самом деле означают три C.

Научный вызов

Эта характеристика проекта полезна, если вы хотите специализироваться на технике или приложении (например, НЛП или компьютерное зрение). Я всегда нахожу эти проекты полезными, потому что они развивают мое теоретическое понимание машинного обучения, и мне легко отслеживать свой прогресс в обучении.

Типичные действия, которые вы можете найти в подобном проекте:

  • Обзор академической литературы для определения современного подхода
  • Реализуем модель из бумаги и адаптируем ее под вашу задачу
  • Эксперименты с новыми программными библиотеками и реализациями моделей с открытым исходным кодом

Творческое решение проблем

Вы часто найдете эту характеристику в проектах в стиле консалтинга, которые требуют быстрых и творческих способов решения реальных проблем с помощью машинного обучения. Ключевые проблемы - это привыкнуть к новой среде и получить готовое к работе решение машинного обучения в рамках фиксированного времени и бюджета. Эти проекты могут быть захватывающими, потому что они часто позволяют быстро итерировать решение.

Типичные действия, которые вы найдете в подобном проекте:

  • Взаимодействие с клиентами по требованию понимания бизнес-проблемы
  • Изучение предоставленных данных и локальной инфраструктуры для оценки возможности интеграции решения машинного обучения.
  • Создание концепции «80/20» для проверки сценария использования машинного обучения.

Влияние на клиента

Проекты, оказывающие влияние на клиентов, имеют четко определенное ценностное предложение и часто добавляют функции машинного обучения к существующим продуктам. Таким образом, усовершенствования модели могут быть переданы непосредственно в руки пользователей. Это делает эти проекты идеальным местом для инженеров машинного обучения и всех, кто хочет улучшить свои инженерные навыки. Я получаю большое удовлетворение от положительных отзывов пользователей («это экономит мне рабочие дни каждую неделю»), и мне нравится измерять свое влияние по ценности, которую я создаю для пользователей моих моделей.

Типичные действия, которые вы можете найти в подобном проекте:

  • Тесное сотрудничество с разработчиками программного обеспечения для создания модели
  • Проведение A / B-тестирования для оценки улучшений модели
  • Извлечение данных от существующих пользователей для обучения моделей

Выберите две C

Делая выбор карьеры специалиста по данным, подумайте о трех C и о том, какие C вы ищете. Не ожидайте, что все три будут в одном проекте. Исходя из моего опыта, хорошие проекты в области науки о данных имеют тенденцию попадать на пересечения:

«Глубокие технологии»

Вы часто найдете эти проекты в технологических стартапах и отделах исследований и разработок крупных компаний. Новые технологии и методы моделирования применяются к открытым проблемам, способным подорвать целые отрасли. Специалистам по обработке данных часто необходимо разрабатывать современные модели, чтобы получить конкурентное преимущество. Однако для практического использования моделей может потребоваться развитие крупного бизнеса и инженерные разработки.

«Встраивание машинного обучения»

Многие традиционные компании стремятся внедрить машинное обучение в свои процессы для поддержки своего основного бизнеса. Это создает множество возможностей и проектов для специалистов по данным, чтобы найти низко висящие плоды приложений машинного обучения. Используя существующую ИТ-инфраструктуру, вы можете поставлять простые модели с огромным влиянием.

Часто для бизнеса больше пользы от перехода к другому проекту по разработке другой простой модели, чем от дальнейшего повышения точности существующей. Это мешает специалисту по обработке данных получить практический опыт работы с более передовыми методами и моделями.

«Массовое машинное обучение»

Эти проекты можно найти в компаниях, в основе продукции которых лежат технологии. В них работают большие команды специалистов по обработке данных и инженеров, которые создают новые функции, которые можно масштабировать для миллионов пользователей. В этих средах специалисты по данным могут специализироваться в небольшой нише, где улучшения модели могут привести к значительной экономии и прибыли. Однако с усилением специализации между вами и заказчиком может быть много уровней менеджеров по продуктам / проектам.

И что?

Если вы разочарованы своей текущей ролью / проектом, задайте себе следующие вопросы:

  • Какие вопросы вы хотите привлечь к своим проектам?
  • Какая характеристика вам не хватает?
  • Есть ли в вашей компании другие проекты, которые могли бы это предложить?
  • Рассматривая новую работу: предлагает ли компания те типы проектов, которые вам нужны?