Недавно AWS объявила о проведении специального экзамена по машинному обучению, который рекомендуется для лиц, имеющих опыт работы с данными. Этот экзамен подтверждает навыки, необходимые для создания, обучения, настройки и развертывания моделей машинного обучения (ML) в масштабе с использованием облака AWS.

Я сдал экзамен. Это был хороший опыт подготовки к нему и проверки моих навыков машинного обучения. Если у вас есть практический опыт создания моделей машинного обучения в AWS ML Stack, вы справитесь с задачей.

Поскольку это новый экзамен, я хотел бы поделиться своими мыслями о том, как лучше всего к нему подготовиться:

Практический тест

Прохождение пробного теста на раннем этапе даст хорошее представление о типах вопросов и строгости. Это стоит 40 долларов, но оно того стоит.

Полный обзор документации

Вы узнаете много нового, пройдя информацию по следующим ссылкам.

я. Руководство разработчика по Amazon SageMaker https://docs.aws.amazon.com/sagemaker/latest/dg/whatis.html

II. Руководство разработчика машинного обучения Amazon — https://docs.aws.amazon.com/machine-learning/latest/dg/tutorial.html

Показатели оценки модели

Я видел большое количество вопросов по оценке модели. Очень важно иметь хорошее представление о различных метриках и о том, когда их использовать. Ниже несколько тем:

я. Матрица путаницы

II. Напомним, точность, точность, оценка F1, AUC и т. д.

III. Метрики для моделей регрессии

Подготовка данных

Вы можете ожидать несколько вопросов по следующим темам:

я. Исследовательский анализ данных

II. Разработка функций

III. Преобразование данных — Импутация — https://en.wikipedia.org/wiki/Imputation_(statistics)

IV. Визуализация данных

Встроенные алгоритмы и сервисы более высокого уровня

Вам поможет хорошее знание встроенных алгоритмов Amazon SageMaker и сервисов Amazon AI/ML более высокого уровня, таких как Translate, Transcribe, Comprehend и т. д. Главное знать, какой из них использовать, когда.

Оптимизация гиперпараметров

я. Автоматическая настройка модели

II. Влияние гиперпараметров при проведении распределенного обучения

Глубокое обучение

Хорошее понимание концепций глубокого обучения. Например, где использовать CNN против RNN и т. д. Также поможет знание различных типов слоев CNN — https://en.wikipedia.org/wiki/Convolutional_neural_network.

Сервисы AWS

Прием данных — одна из ключевых тем, поэтому вам поможет хорошее понимание S3, Kinesis, Athena, Glue, EMR, Spark и т. д.

Блоги

Если у вас есть время, просмотрите некоторые из блогов SageMaker по темам, изложенным в руководстве по экзамену.

В целом, это был интересный опыт! Удачи, если решите сдавать экзамен!!!