Что такое регрессия?

Регрессионный анализ — это форма метода прогнозного моделирования, которая исследует взаимосвязь между зависимой и независимой переменной. Модели регрессионного анализа используются для прогнозирования влияния на зависимую переменную различных изменений независимых переменных. Типы регрессии включают простую регрессию, множественную регрессию, линейную регрессию, многомерную регрессию, полиномиальную регрессию и логистическую регрессию.

Линейная регрессия

Линейная регрессия позволяет обобщить и изучить взаимосвязь между двумя (или более) непрерывными (количественными). Эти переменные - одна или несколько зависимых переменных или одна или несколько независимых переменных, но при переходе к линейной регрессии у нас будет только одна зависимая переменная и одна независимая переменная.

Таким образом, линейная регрессия дает модель, которая представляет собой функцию, описывающую взаимосвязь между зависимыми и независимыми переменными. Зависимая переменная, также называемая переменной отклика, и независимые переменные, также называемые предикторами.

Линейная регрессия — это функция, которая прогнозирует зависимую (отклик или результат) переменную на основе значений независимых переменных (прогнозирующих или объяснительных).

Модель с одной регрессией. Рассмотрим модель только с одной независимой переменной.

Модель множественной регрессии: модель с несколькими независимыми переменными.

Давайте рассмотрим пример

1- Доход и уровень образования — Здесь уровень образования рассматривается как независимая переменная, а доход как зависимая переменная, в общем случае не всегда, если человек имеет высокую квалификацию, его доход будет больше. Таким образом, учитывая уровень образования, мы можем построить модель в будущем, имея уровень образования, мы можем предсказать, каков будет доход любого человека.

2 – ЖЕЛ и количество лет курения. По мере увеличения количества курящих (количественно определяемое количеством лет курения) можно ожидать, что функция легких (количественно определяемая жизненной емкостью легких) будет снижаться. , но не идеально.

Несколько распространенных примеров линейной регрессии:

1- Связь между градусами Фаренгейта и градусами Цельсия

2- Окружность:- = π × диаметр

3- Закон Гука:-Y = α +βX, где Y = степень растяжения пружины, и X = примененный вес.

4- Закон Ома:- I = V/r, где V = приложенное напряжение, r = сопротивление и I = ток.

5- Закон Бойля:- При постоянной температуре P = α/V, где P = давление, α = константа для каждого газа, а V = объем газа.

Разница между линейной регрессией и логистической регрессией

Как нарисовать линию наилучшего соответствия (с использованием метода наименьших квадратов)

При рисовании линии регрессии (линия наилучшего соответствия называется линия регрессии) цель состоит в том, чтобы линия максимально точно соответствовала точкам. Мы делаем это, делая сумму квадратов отклонений как можно меньше.

Более точным способом поиска линии наилучшего соответствия является метод наименьших квадратов. Если с помощью этого принципа найдена линия наилучшего соответствия, она называется линией регрессии методом наименьших квадратов.

Теперь давайте продолжим и посмотрим на математическую реализацию этого. Здесь я рисую наиболее подходящую линию для времени и расстояния, пройденного спринтером.

Теперь постройте график для приведенной выше таблицы —

Шаг 1:-

Вычислите среднее значение значений Time и среднее значение Distance.

Таким образом, среднее значение времени (X):

И среднее расстояние (Y):

Шаг 2:-

Следующая формула дает наклон линии наилучшего соответствия:

Теперь таблица: -

Шаг 3:-

Вычислите точку пересечения Y линии, используя формулу:

Шаг 4:-

Используйте наклон m и точку пересечения y C, чтобы сформировать уравнение линии.

Итак, для данных m = 0,4 и C = 2,4 давайте предскажем значения Y для X = {1,2,3,4,5}

Y = 0.4*1 + 2.4 = 2.8

Y = 0.4*2 + 2.4 = 3.2

Y = 0.4*3 + 2.4 = 3.6

Y = 0.4*4 + 2.4 = 4.0

Y = 0.4*5 + 2.4 = 4.4

Теперь задача состоит в том, чтобы рассчитать фактическое и прогнозируемое значение, а основная задача состоит в том, чтобы уменьшить расстояние. Другими словами, мы должны уменьшить ошибку между фактическим и прогнозируемым значением.

Линия с наименьшей ошибкой будет линией линейной регрессии или линией регрессии, а также будет линией наилучшего соответствия.

Итак, как эта работа вычисляет, так что мы выполняем n количество итераций для разных значений m. Для разных значений m будет вычислено уравнение линии y = mx + c.

По мере изменения значения m строка меняется, поэтому итерация начнется с 1 и будет выполнять n число итераций. Таким образом, после каждой итерации он будет вычислять прогнозируемое значение в соответствии с линией и сравнивать расстояние фактического значения с прогнозируемым значением и значением m, для которого будет выбрано минимальное расстояние между фактическим и прогнозируемым значением. Как наилучшее соответствие Линия.

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Если вам понравилось читать этот пост, пожалуйста, поделитесь им и дайте несколько аплодисментов, чтобы другие могли его найти 👏👏👏👏👏 !!!!

Вы можете следить за мной на Medium, чтобы получать свежие статьи. Кроме того, свяжитесь со мной в LinkedIn.

Если у вас есть какие-либо комментарии, вопросы или рекомендации, не стесняйтесь публиковать их в разделе комментариев ниже!