Линейная регрессия является основным и наиболее широко используемым типом прогнозного анализа.

Содержание

  1. Определить
  2. Цель линейной регрессии
  3. Типы линейной регрессии
  4. Допущения линейной регрессии
  5. Показатели оценки
  6. Что нужно помнить
  7. Приложения
  8. Ссылки

Определение

Линейная регрессия — это один из простейших алгоритмов машинного обучения с учителем, который помогает найти взаимосвязь между одной или несколькими независимыми переменными (предикторами), обозначенными как X, и зависимыми переменными ( цель )обозначается как y.

y (левая сторона здесь) также известна как зависимые переменные, переменная ответа или переменная результата.

X (правая сторона здесь) также известен какнезависимые переменные, независимые переменные или переменные-предикторы.

На приведенной выше диаграмме синие точки показывают нам распределение yw.r.t. х. Не существует такой прямой линии, которая проходит через все точки данных. Таким образом, основная цель здесь состоит в том, чтобы наилучшим образом подобрать линию регрессии, которая попытается минимизировать ошибку между фактическими и прогнозируемыми значениями.

Поиск наиболее подходящей линии

Минимизируя расстояние (или, скажем, ошибку) между всеми точками данных и линией регрессии, мы можем найти наилучшую линию для нашего набора данных. Существуют различные способы, с помощью которых мы можем минимизировать расстояние, например, используя сумму квадратов ошибок, сумму абсолютных ошибок или среднеквадратичную ошибку и т. д.

Наша главная цель — минимизировать функцию стоимости, обновляя различные значения θ. Минимальное значение функции стоимости даст нам наиболее подходящую линию регрессии для нашего набора данных.

Типы линейной регрессии:

Линейная регрессия обычно делится на два типа:

  • Простая линейная регрессия. В простой линейной регрессии у нас есть только одна независимая переменная X и соответствующая переменная y.
  • Множественная линейная регрессия. В множественной линейной регрессии у нас есть одна или несколько независимых переменных X и соответствующая переменная y.

Допущения линейной регрессии:-

  1. Нормальность:- при любом фиксированном значении X y нормально распределяется.
  2. Линейность :- связь между X и y является линейной.
  3. Независимость. Наблюдения не зависят друг от друга.
  4. Гомоскедастичность. Дисперсия остатка одинакова для любого значения X.

Метрики оценки в линейных регрессиях: -

Ниже приведены некоторые показатели оценки линейной регрессии.

  • Среднеквадратическая ошибка (MSE).MSE в основном дает нам среднеквадратичную разницу между прогнозируемым значением и фактическим значением данных. Он имеет выпуклую форму и штрафует за большие ошибки.

  • Средняя абсолютная ошибка (MAE). Она просто дает нам абсолютную разницу между целевым значением и прогнозируемым значением.

  • Среднеквадратическая ошибка (RMSE) :-Это дает нам квадратный корень из средней разницы между прогнозируемым и фактическим значением.

Что следует помнить: –

  • Он используется для решения проблемы регрессии.
  • Переменные ответа являются непрерывными по своей природе.
  • Линейная регрессия чувствительна к выбросам.

Применение линейной регрессии:

Ниже приведены несколько приложений линейной регрессии в реальной жизни в разных областях.

Бизнес-приложение: например: расходы на рекламу и доход.

Медицинское применение: пример: дозировка лекарств и артериальное давление пациентов

Применение в сельском хозяйстве: пример: влияние удобрений и воды на урожайность.

Использованная литература :-

  1. Википедия
  2. Блог о науке о данных
  3. Несколько других блогов