Вопросы, которые следует ожидать новичку в отрасли

В: Какие два параметра определяют нормальное распределение?

A : Среднее значение, определяющее среднюю точку. Стандартное отклонение, определяющее ширину.

В: Что такое одно горячее кодирование?

A: Процесс преобразования категориальных переменных в числовые значения таким образом, что каждая категория становится столбцом, а принадлежность строки к этой категории обозначается 1 или 0. Не очень эффективно, когда категорий много.

В: Что такое остаток?

A: Это разница между наблюдаемым значением и прогнозируемым значением целевого значения.

В: Объясните основную концепцию случайного леса?

A: Ансамбльный подход к поиску дерева решений, которое лучше всего соответствует обучающим данным, путем создания множества деревьев решений и последующего определения «среднего».

В: Что такое уменьшение размерности?

A: Это процесс уменьшения количества рассматриваемых переменных путем получения набора основных компонентов.

В: Что означает «случайный» в термине Random Forest?

A: «Случайная» часть термина относится к построению каждого из деревьев решений из случайного выбора функций путем начальной загрузки.

В: Что такое неконтролируемое обучение?

A: Неконтролируемое обучение направлено на обнаружение закономерностей в данных, которым не присвоены метки.

Вот и все ! Оставайтесь с нами, чтобы узнать больше.

Вопросы взяты из: