Как я нахожу проекты, которые подходят мне
В погоне за самой сексуальной работой 21 века специалисты по обработке данных часто начинают работу с нереалистичными ожиданиями или заканчивают проектами, которые не соответствуют их карьерным устремлениям. Я определенно попадал в одну и ту же ловушку несколько раз. Возможно, вы тоже пережили нечто подобное.
В начале своей карьеры я часто расстраивался из-за проектов, потому что я хотел делать все это - глубокие научные исследования с одной стороны и работу, ориентированную на клиента, с другой. Работая в разных компаниях, я понял, что проекты DS могут иметь очень разные характеристики в зависимости от компании и типа решаемой проблемы.
За это время я в конце концов пришел к выводу, что могу классифицировать и оценивать типы проектов DS, используя три категории, которые я называю «тремя C»:
- Научная задача: необходимы передовые методы машинного обучения (ML).
- Креативное решение проблем: есть большая открытая проблема, у которой нет очевидного решения.
- Влияние на клиента: есть четкий сценарий использования и производственная инфраструктура. Предоставление анализа или модели напрямую влияет на ценность для клиентов
На самом деле, вы можете выбрать только две C для проекта по науке о данных!
Давайте подробнее рассмотрим, что на самом деле означают три C.
Научный вызов
Эта характеристика проекта полезна, если вы хотите специализироваться на технике или приложении (например, НЛП или компьютерное зрение). Я всегда нахожу эти проекты полезными, потому что они развивают мое теоретическое понимание машинного обучения, и мне легко отслеживать свой прогресс в обучении.
Типичные действия, которые вы можете найти в подобном проекте:
- Обзор академической литературы для определения современного подхода
- Реализуем модель из бумаги и адаптируем ее под вашу задачу
- Эксперименты с новыми программными библиотеками и реализациями моделей с открытым исходным кодом
Творческое решение проблем
Вы часто найдете эту характеристику в проектах в стиле консалтинга, которые требуют быстрых и творческих способов решения реальных проблем с помощью машинного обучения. Ключевые проблемы - это привыкнуть к новой среде и получить готовое к работе решение машинного обучения в рамках фиксированного времени и бюджета. Эти проекты могут быть захватывающими, потому что они часто позволяют быстро итерировать решение.
Типичные действия, которые вы найдете в подобном проекте:
- Взаимодействие с клиентами по требованию понимания бизнес-проблемы
- Изучение предоставленных данных и локальной инфраструктуры для оценки возможности интеграции решения машинного обучения.
- Создание концепции «80/20» для проверки сценария использования машинного обучения.
Влияние на клиента
Проекты, оказывающие влияние на клиентов, имеют четко определенное ценностное предложение и часто добавляют функции машинного обучения к существующим продуктам. Таким образом, усовершенствования модели могут быть переданы непосредственно в руки пользователей. Это делает эти проекты идеальным местом для инженеров машинного обучения и всех, кто хочет улучшить свои инженерные навыки. Я получаю большое удовлетворение от положительных отзывов пользователей («это экономит мне рабочие дни каждую неделю»), и мне нравится измерять свое влияние по ценности, которую я создаю для пользователей моих моделей.
Типичные действия, которые вы можете найти в подобном проекте:
- Тесное сотрудничество с разработчиками программного обеспечения для создания модели
- Проведение A / B-тестирования для оценки улучшений модели
- Извлечение данных от существующих пользователей для обучения моделей
Выберите две C
Делая выбор карьеры специалиста по данным, подумайте о трех C и о том, какие C вы ищете. Не ожидайте, что все три будут в одном проекте. Исходя из моего опыта, хорошие проекты в области науки о данных имеют тенденцию попадать на пересечения:
«Глубокие технологии»
Вы часто найдете эти проекты в технологических стартапах и отделах исследований и разработок крупных компаний. Новые технологии и методы моделирования применяются к открытым проблемам, способным подорвать целые отрасли. Специалистам по обработке данных часто необходимо разрабатывать современные модели, чтобы получить конкурентное преимущество. Однако для практического использования моделей может потребоваться развитие крупного бизнеса и инженерные разработки.
«Встраивание машинного обучения»
Многие традиционные компании стремятся внедрить машинное обучение в свои процессы для поддержки своего основного бизнеса. Это создает множество возможностей и проектов для специалистов по данным, чтобы найти низко висящие плоды приложений машинного обучения. Используя существующую ИТ-инфраструктуру, вы можете поставлять простые модели с огромным влиянием.
Часто для бизнеса больше пользы от перехода к другому проекту по разработке другой простой модели, чем от дальнейшего повышения точности существующей. Это мешает специалисту по обработке данных получить практический опыт работы с более передовыми методами и моделями.
«Массовое машинное обучение»
Эти проекты можно найти в компаниях, в основе продукции которых лежат технологии. В них работают большие команды специалистов по обработке данных и инженеров, которые создают новые функции, которые можно масштабировать для миллионов пользователей. В этих средах специалисты по данным могут специализироваться в небольшой нише, где улучшения модели могут привести к значительной экономии и прибыли. Однако с усилением специализации между вами и заказчиком может быть много уровней менеджеров по продуктам / проектам.
И что?
Если вы разочарованы своей текущей ролью / проектом, задайте себе следующие вопросы:
- Какие вопросы вы хотите привлечь к своим проектам?
- Какая характеристика вам не хватает?
- Есть ли в вашей компании другие проекты, которые могли бы это предложить?
- Рассматривая новую работу: предлагает ли компания те типы проектов, которые вам нужны?