Публикации по теме 'ridge-regression'
Регрессия и ее виды.
В прошлом посте мы рассмотрели, что такое машинное обучение и его виды. Там я обсуждал, что контролируемое обучение является одним из методов. Сегодня давайте обсудим, что такое регрессионный анализ и каковы его разновидности.
Что такое регрессия?
Регрессия прогнозирует среднее значение целевой переменной на основе значений других переменных (независимых переменных). Примерами могут быть время и стоимость, когда стоимость может зависеть от различных других факторов, и необходимо..
Набор данных о лесных пожарах в Алжире
У нас есть интересный набор данных о лесных пожарах в Алжире, где нам нужно предсказать, будет ли пожар или нет, на основе различных независимых признаков. Поскольку это проблема классификации, я подумал о преобразовании ее в задачу регрессии, в которой мы будем прогнозировать индекс пожарной погоды (FWI), который будет нашей зависимой функцией.
Давайте углубимся в набор данных, который мы получили от Kaggle.
Информация о наборе данных:
Набор данных включает 244 экземпляра, которые..
Введение в регуляризацию
Когда модель действительно хорошо работает на наборе поездов, но плохо работает на невидимых данных, мы знаем, что у нас есть проблема: переоснащение. Мы знаем, что существует компромисс между предвзятостью и дисперсией. Простая модель будет иметь высокое смещение и низкую дисперсию, тогда как сложная модель будет иметь низкое смещение и высокую дисперсию. В любом случае общая ошибка будет высокой.
Нам нужна наименьшая общая ошибка, то есть низкое смещение и низкая дисперсия.
Для..
Проблема переобучения
.. и как с этим бороться — Часть 2
В Части 1 этого блога я довольно подробно описал проблему переобучения, и мы увидели, как переоснащенная модель хорошо работает на обучающем наборе данных, но не может обобщать. В этом блоге мы обсудим Регуляризацию , широко используемый метод для решения проблемы переобучения.
Регуляризация — это метод, который снижает сложность модели ML, добавляя штраф к функции потерь. Функция штрафа или «термин регуляризации» добавляется ко всем параметрам..
Регуляризация: Ридж и Лассо
Регуляризация – это процесс добавления информации для решения проблем машинного обучения, таких как переобучение. Это одна из самых важных концепций машинного обучения. С математической точки зрения регуляризация может применяться к задачам оптимизации, где можно добавить член регуляризации или штраф, чтобы найти оптимальное решение задачи оптимизации.
Наиболее часто используемые методы регуляризации следующие:
Регуляризация L1 Регуляризация L2
Чтобы лучше понять Ридж и..
Выбор характеристик линейной модели
выбор важных функций
Иногда даже самый простой из алгоритмов линейная регрессия может казаться немного перегруженной множеством функций X для прогнозирования переменной отклика Y.
С многомерными функциями модель может потерять свою интерпретируемость и может оказаться трудным объяснить особенности, ответственные за дисперсию в переменной отклика Y.
С многомерными элементами модель могла потерять свою предсказательную силу на тестовых данных из-за одного из следующих..
Введение в регуляризацию с использованием регрессий Риджа и Лассо
Вы можете спросить себя: зачем нужна регуляризация?
Прежде всего, регуляризация регрессионных моделей позволяет избежать переобучения при автоматической подгонке нашей модели. Регуляризация выполняется путем добавления штрафа к нашей функции потерь. Вспомните нашу функцию потерь для простой регрессии методом наименьших квадратов (OLS). Путем выбора значения бета, которое минимизирует сумму квадратов ошибок (SSE), находится линия наилучшего соответствия.
Переоснащение может..