Разберитесь —«Логистическая регрессия за 5 минут» 🐱‍🏍

Учитывая набор данных, в котором вам нужно классифицировать события или классы, такие как «прошел/не прошел», «истина/ложь», «выигрыш/проигрыш», «здоров/боль» и т. д., логистическая регрессия будет отличным выбором для использования. Логистическая регрессия — это статистическая модель, в которой для моделирования бинарной зависимой переменной использовалась логистическая функция или сигмовидная функция.

Чтобы понять, когда использовать логистическую регрессию, давайте предположим, что вы старший специалист по данным в Disney+, и ваша задача — выяснить, какая возрастная группа людей откликается на рекламную кампанию нового фильма «Полный дом 4».

Вам был предоставлен набор данных, состоящий из кампании, проведенной для Houseful 3, и их результатов (люди какой возрастной группы дали положительный ответ). Таким образом, вы обязаны найти подходящую возрастную группу людей для рекламы Houseful 4.

Давайте сначала посмотрим на набор данных 👇

Здесь мы видим проблему, мы можем просто подогнать подобную строку и сделать это проблемой классификации. Мы можем!!!😁, но результаты будут худшими 👈. Используя логистическую регрессию, мы можем нарисовать наиболее подходящую линию для данного набора данных, используя сигмовидную функцию.

МАТЕМАТИКА 🐱‍🚀, стоящая за логистической регрессией

Модель:

Выход: 0 или 1, Истина или Ложь

Гипотеза: Z = WX + B

hΘ(x) = сигмоид (Z)

Гипотеза логистической регрессии, ее функция стоимости находится в диапазоне от 0 до 1. Сигмовидная функция используется для прогнозирования вероятности.

Логистическая функция или сигмовидная функция:

Давайте сначала поймем, как нарисовать нелинейную линию для классификации набора данных. Просто сигмоидальная функция преобразует реальное значение в другое значение, например, от 0 до 1.

Сигмоид творит чудеса!!! 🧛‍♂️

Простой вывод из линейной регрессии 👇

Важно понимать взаимосвязь между линейной регрессией и логистической регрессией.

При использовании линейной регрессии мы использовали формулу гипотезы, т.е.

hΘ(x) = β₀ + β₁X

и Для логистической регрессии мы немного изменим формулу линейной регрессии, т.е. (см. вывод на рис. 3) 👇

Функция стоимости:

Возможно, вы узнали о функции стоимости в простой линейной регрессии, стоимости J(θ) и ее минимизации помогают в создании наилучшей модели и высокая точность.

Но в логистической регрессии, если мы используем функцию стоимости линейной регрессии, то она закончится нелинейным выпуклым графом, который бесполезен и будет иметь много локальных минимумов.

Функция стоимости логистической регрессии:

И график выглядит так 👇

Вывод:

Спасибо, что читаете мой блог, мне очень приятно🙏. Я надеюсь, что этот блог поможет вам понять логистическую регрессию.