6 марта 2019 г.

Не так давно я работал над проектом по машинному обучению для своей школьной курсовой работы с действительно талантливым товарищем по команде, который всегда находил время, чтобы поделиться со мной своими знаниями о новой технологии, которую он изучает на работе. Он поделился своим временем на конференции AWS, где узнал о продукте Amazon SageMaker. Как энтузиаст машинного обучения, я был взволнован и сразу же начал искать возможности для участия в таком обучении. К счастью, на этой неделе у меня была возможность принять участие в одной из многочисленных онлайн-конференций AWS Innovate, чтобы узнать об Amazon SageMaker.

Во-первых, я узнал о стеке сервисов машинного обучения AWS.

Службы искусственного интеллекта. Вам просто нужно вызвать API и выполнить свою работу!

Службы машинного обучения: О да, интересующая меня тема, Amazon SageMaker попадает в этот сервис. Это дает вам полный контроль над алгоритмами машинного обучения, с которыми вы хотите работать, и устраняет проблемы с инфраструктурой.

Структуры и инфраструктура машинного обучения. Это когда вы хотите самостоятельно работать как с платформами машинного обучения, так и с инфраструктурой.

Довольно круто! Не так ли?

Спасибо Шьяму Шринивасану, старшему менеджеру по продуктам в AWS, за замечательную презентацию, которая помогла мне начать работу с Amazon SageMaker.

На приведенном выше изображении показан общий рабочий процесс создания, обучения и развертывания моделей машинного обучения в масштабе с помощью Amazon SageMaker.

Сборка. Этот этап включает в себя сбор и подготовку обучающих данных, а также выбор и оптимизацию алгоритма машинного обучения, который мы выбираем для наших данных.

Подготовка данных. Amazon SageMaker позволяет нам использовать блокноты Jupyter, в которых уже есть готовые рабочие процессы для решения распространенных проблем, для очистки необработанных данных для дальнейшего использования. Кроме того, существует Amazon SageMaker Ground Truth, который помогает эффективно маркировать обучающие данные и доказал свою эффективность в снижении затрат на маркировку. Я расскажу об основных истинах Amazon SageMaker в своем следующем сообщении в блоге.

Выбор алгоритма машинного обучения. В AWS Marketplace доступно более 200 встроенных и настроенных алгоритмов машинного обучения. Что ж, у вас также есть возможность разработать алгоритм, встроив его в контейнер Docker.

Обучение. Этот шаг включает в себя обучение и настройку моделей после настройки среды обучения.

Настройка обучающих сред и управление ими. Amazon SageMaker самостоятельно обрабатывает всю инфраструктуру, что позволяет нам легко обучать нашу модель. Инстансы Amazon EC2 P3dn предоставляют GPU, оптимизированные для быстрого машинного обучения в облаке.

Оптимизация модели. Он имеет автоматическую настройку модели, которая выполняет оптимизацию гиперпараметров, чтобы обнаружить интересные функции и то, как эти функции влияют на точность. Кроме того, Amazon SageMaker Neo был представлен для повышения производительности за счет однократного обучения модели и развертывания ее в любом месте. Я также расскажу об Amazon SageMaker Neo в своем следующем посте в блоге.

Развертывание.Последний этап развертывания в рабочей среде – это всего лишь один щелчок. Он полностью управляется автоматическим масштабированием и встроенным A/B-тестированием. Благодаря AWS Greengrass модели, обученные с помощью Amazon SageMaker, можно легко развернуть на периферийных устройствах для выполнения логических выводов (прогнозов).

Наконец, было довольно интересно узнать об Amazon Elastic Inference, который позволяет вам выбрать тип инстанса, который соответствует потребностям ЦП и памяти, а затем позволяет настроить правильное количество ускорения графического процессора, необходимое для ваших прогнозов, тем самым снижая затраты.

Чтобы узнать больше, я рекомендую вам ознакомиться с их страницей продукта и видео по запросу от AWS Innovate. Приятного обучения!