Что такое регрессия?
Регрессионный анализ — это форма метода прогнозного моделирования, которая исследует взаимосвязь между зависимой и независимой переменной. Модели регрессионного анализа используются для прогнозирования влияния на зависимую переменную различных изменений независимых переменных. Типы регрессии включают простую регрессию, множественную регрессию, линейную регрессию, многомерную регрессию, полиномиальную регрессию и логистическую регрессию.
Линейная регрессия
Линейная регрессия позволяет обобщить и изучить взаимосвязь между двумя (или более) непрерывными (количественными). Эти переменные - одна или несколько зависимых переменных или одна или несколько независимых переменных, но при переходе к линейной регрессии у нас будет только одна зависимая переменная и одна независимая переменная.
Таким образом, линейная регрессия дает модель, которая представляет собой функцию, описывающую взаимосвязь между зависимыми и независимыми переменными. Зависимая переменная, также называемая переменной отклика, и независимые переменные, также называемые предикторами.
Линейная регрессия — это функция, которая прогнозирует зависимую (отклик или результат) переменную на основе значений независимых переменных (прогнозирующих или объяснительных).
Модель с одной регрессией. Рассмотрим модель только с одной независимой переменной.
Модель множественной регрессии: модель с несколькими независимыми переменными.
Давайте рассмотрим пример
1- Доход и уровень образования — Здесь уровень образования рассматривается как независимая переменная, а доход как зависимая переменная, в общем случае не всегда, если человек имеет высокую квалификацию, его доход будет больше. Таким образом, учитывая уровень образования, мы можем построить модель в будущем, имея уровень образования, мы можем предсказать, каков будет доход любого человека.
2 – ЖЕЛ и количество лет курения. По мере увеличения количества курящих (количественно определяемое количеством лет курения) можно ожидать, что функция легких (количественно определяемая жизненной емкостью легких) будет снижаться. , но не идеально.
Несколько распространенных примеров линейной регрессии:
1- Связь между градусами Фаренгейта и градусами Цельсия
2- Окружность:- = π × диаметр
3- Закон Гука:-Y = α +βX, где Y = степень растяжения пружины, и X = примененный вес.
4- Закон Ома:- I = V/r, где V = приложенное напряжение, r = сопротивление и I = ток.
5- Закон Бойля:- При постоянной температуре P = α/V, где P = давление, α = константа для каждого газа, а V = объем газа.
Разница между линейной регрессией и логистической регрессией
Как нарисовать линию наилучшего соответствия (с использованием метода наименьших квадратов)
При рисовании линии регрессии (линия наилучшего соответствия называется линия регрессии) цель состоит в том, чтобы линия максимально точно соответствовала точкам. Мы делаем это, делая сумму квадратов отклонений как можно меньше.
Более точным способом поиска линии наилучшего соответствия является метод наименьших квадратов. Если с помощью этого принципа найдена линия наилучшего соответствия, она называется линией регрессии методом наименьших квадратов.
Теперь давайте продолжим и посмотрим на математическую реализацию этого. Здесь я рисую наиболее подходящую линию для времени и расстояния, пройденного спринтером.
Теперь постройте график для приведенной выше таблицы —
Шаг 1:-
Вычислите среднее значение значений Time и среднее значение Distance.
Таким образом, среднее значение времени (X):
И среднее расстояние (Y):
Шаг 2:-
Следующая формула дает наклон линии наилучшего соответствия:
Теперь таблица: -
Шаг 3:-
Вычислите точку пересечения Y линии, используя формулу:
Шаг 4:-
Используйте наклон m и точку пересечения y C, чтобы сформировать уравнение линии.
Итак, для данных m = 0,4 и C = 2,4 давайте предскажем значения Y для X = {1,2,3,4,5}
Y = 0.4*1 + 2.4 = 2.8
Y = 0.4*2 + 2.4 = 3.2
Y = 0.4*3 + 2.4 = 3.6
Y = 0.4*4 + 2.4 = 4.0
Y = 0.4*5 + 2.4 = 4.4
Теперь задача состоит в том, чтобы рассчитать фактическое и прогнозируемое значение, а основная задача состоит в том, чтобы уменьшить расстояние. Другими словами, мы должны уменьшить ошибку между фактическим и прогнозируемым значением.
Линия с наименьшей ошибкой будет линией линейной регрессии или линией регрессии, а также будет линией наилучшего соответствия.
Итак, как эта работа вычисляет, так что мы выполняем n количество итераций для разных значений m. Для разных значений m будет вычислено уравнение линии y = mx + c.
По мере изменения значения m строка меняется, поэтому итерация начнется с 1 и будет выполнять n число итераций. Таким образом, после каждой итерации он будет вычислять прогнозируемое значение в соответствии с линией и сравнивать расстояние фактического значения с прогнозируемым значением и значением m, для которого будет выбрано минимальное расстояние между фактическим и прогнозируемым значением. Как наилучшее соответствие Линия.
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
Если вам понравилось читать этот пост, пожалуйста, поделитесь им и дайте несколько аплодисментов, чтобы другие могли его найти 👏👏👏👏👏 !!!!
Вы можете следить за мной на Medium, чтобы получать свежие статьи. Кроме того, свяжитесь со мной в LinkedIn.
Если у вас есть какие-либо комментарии, вопросы или рекомендации, не стесняйтесь публиковать их в разделе комментариев ниже!