Вопросы, которые следует ожидать новичку в отрасли
В: Какие два параметра определяют нормальное распределение?
A : Среднее значение, определяющее среднюю точку. Стандартное отклонение, определяющее ширину.
В: Что такое одно горячее кодирование?
A: Процесс преобразования категориальных переменных в числовые значения таким образом, что каждая категория становится столбцом, а принадлежность строки к этой категории обозначается 1 или 0. Не очень эффективно, когда категорий много.
В: Что такое остаток?
A: Это разница между наблюдаемым значением и прогнозируемым значением целевого значения.
В: Объясните основную концепцию случайного леса?
A: Ансамбльный подход к поиску дерева решений, которое лучше всего соответствует обучающим данным, путем создания множества деревьев решений и последующего определения «среднего».
В: Что такое уменьшение размерности?
A: Это процесс уменьшения количества рассматриваемых переменных путем получения набора основных компонентов.
В: Что означает «случайный» в термине Random Forest?
A: «Случайная» часть термина относится к построению каждого из деревьев решений из случайного выбора функций путем начальной загрузки.
В: Что такое неконтролируемое обучение?
A: Неконтролируемое обучение направлено на обнаружение закономерностей в данных, которым не присвоены метки.
Вот и все ! Оставайтесь с нами, чтобы узнать больше.
Вопросы взяты из: