Что такое регрессия?

Регрессионный анализ — это статистический метод анализа и понимания связи между двумя или более переменными. Метод, используемый для регрессионного анализа, помогает определить, какие переменные релевантны, какие можно игнорировать и как они взаимодействуют.

Давайте разберемся на примере -

Если вы когда-либо брали такси или такси, вы знакомы с регрессией. Вот как это происходит. Когда вы садитесь в такси, вы видите, что есть предустановленная плата за проезд. Предустановленная (постоянная) плата за проезд составляет 2,50 доллара США, такси движется или вы выходите, когда вы садитесь в такси, это то, что вы должны водителю. Это константа. Если вы сели в такси, вам придется заплатить эту сумму. Затем, когда он начинает двигаться, плата за проезд увеличивается на определенную сумму за каждый метр или сотню метров.
Таким образом, помимо константы существует дробь, связь между расстоянием и суммой, которую вы потратите. А если вы не двигаетесь и попали в пробку, вам придется доплачивать за каждую последующую минуту. В результате ваш тариф повышается с течением времени. Стоимость проезда увеличивается пропорционально пройденному расстоянию. И вы уже оплатили базовый тариф, который является постоянным, пока все это происходит. Регрессия именно такая. Регрессия показывает базовый тариф, а также связь между временем и оплаченным тарифом, а также пройденным расстоянием и оплаченным тарифом. Потому что регрессия позволяет вам вычислить константу, которую вы не знали, при отсутствии знания этих взаимосвязей и просто зная, сколько люди путешествовали и сколько они заплатили. Это было 2,50 доллара, оно рассчитывало соотношение между тарифом и расстоянием, а также тарифом и временем. Это Регрессия.

Типы регрессии

1. Линейная регрессия

Линейный регрессионный анализ — это метод прогнозирования значения одной переменной на основе значения другой. Зависимая переменная — это та, которую вы хотите спрогнозировать. Независимая переменная — это переменная, которую вы используете для прогнозирования значения другой переменной.

Уравнение для линии линейной регрессии: Y = a + bX, где X является независимой переменной, а Y в качестве зависимой переменной. Пересечение (значение y при x = 0) равно a, а наклон линии равен b.

2. Полиномиальная регрессия

Полиномиальная регрессия используется, когда связь между зависимой и независимой переменной нелинейна. Для этого используется метод наименьших квадратов. В этом типе регрессии мощность независимого уравнения больше единицы. Короче говоря, этот тип регрессии обычно используется с криволинейными данными.

Уравнение полиномиальной регрессии:y=a+b*x² ()

Фундаментальный недостаток этой формы регрессионной модели заключается в том, что если мы добавим ненужные дополнительные функции или подберем полиномы более высокой степени, мы рискуем переобучить модель.

3. Логистическая регрессия

Когда зависимая переменная является дискретной, вместо линейной регрессии используется логистическая регрессия. Разновидность биномиальной регрессии, логистическая регрессия оценивает параметры стратегической модели. В результате это используется для управления информацией с двумя возможными результатами. Связь между моделями и показателями используется для прогнозирования вероятности события с двумя возможными исходами: да или нет.

Это 3 наиболее важных типа техник регрессии, которые должен изучить каждый.

Важность регрессионного анализа

Регрессионный анализ используется для прогнозирования и прогнозирования. Это тесно связано с темой машинного обучения. Этот статистический метод используется в различных отраслях, в том числе,

1. Финансовая отрасль — понимание тенденций цен на акции, прогнозирование цен и оценка рисков в области страхования.

2. Медицина — для создания общих методов лечения болезней, прогнозирования различных комбинаций лекарств.

3. Производство — Изучите взаимосвязь между переменными, чтобы определить лучший механизм, который может обеспечить лучшие результаты.

4. Маркетинг — анализируйте успех маркетинговых инициатив и оценивайте цену продукта и объем продаж.

При работе с регрессионным анализом очень важно иметь полное представление о постановке задачи. Мы должны использовать линейную регрессию, если в постановке вопроса упоминается прогнозирование. Если в постановке проблемы содержится призыв к бинарной классификации, следует использовать логистическую регрессию. Точно так же мы должны проверить все наши регрессионные модели на основе описания проблемы.