Учитывая набор данных, в котором вам нужно классифицировать события или классы, такие как «прошел/не прошел», «истина/ложь», «выигрыш/проигрыш», «здоров/боль» и т. д., логистическая регрессия будет отличным выбором для использования. Логистическая регрессия — это статистическая модель, в которой для моделирования бинарной зависимой переменной использовалась логистическая функция или сигмовидная функция.
Чтобы понять, когда использовать логистическую регрессию, давайте предположим, что вы старший специалист по данным в Disney+, и ваша задача — выяснить, какая возрастная группа людей откликается на рекламную кампанию нового фильма «Полный дом 4».
Вам был предоставлен набор данных, состоящий из кампании, проведенной для Houseful 3, и их результатов (люди какой возрастной группы дали положительный ответ). Таким образом, вы обязаны найти подходящую возрастную группу людей для рекламы Houseful 4.
Давайте сначала посмотрим на набор данных 👇
Здесь мы видим проблему, мы можем просто подогнать подобную строку и сделать это проблемой классификации. Мы можем!!!😁, но результаты будут худшими 👈. Используя логистическую регрессию, мы можем нарисовать наиболее подходящую линию для данного набора данных, используя сигмовидную функцию.
МАТЕМАТИКА 🐱🚀, стоящая за логистической регрессией
Модель:
Выход: 0 или 1, Истина или Ложь
Гипотеза: Z = WX + B
hΘ(x) = сигмоид (Z)
Гипотеза логистической регрессии, ее функция стоимости находится в диапазоне от 0 до 1. Сигмовидная функция используется для прогнозирования вероятности.
Логистическая функция или сигмовидная функция:
Давайте сначала поймем, как нарисовать нелинейную линию для классификации набора данных. Просто сигмоидальная функция преобразует реальное значение в другое значение, например, от 0 до 1.
Сигмоид творит чудеса!!! 🧛♂️
Простой вывод из линейной регрессии 👇
Важно понимать взаимосвязь между линейной регрессией и логистической регрессией.
При использовании линейной регрессии мы использовали формулу гипотезы, т.е.
hΘ(x) = β₀ + β₁X
и Для логистической регрессии мы немного изменим формулу линейной регрессии, т.е. (см. вывод на рис. 3) 👇
Функция стоимости:
Возможно, вы узнали о функции стоимости в простой линейной регрессии, стоимости J(θ) и ее минимизации помогают в создании наилучшей модели и высокая точность.
Но в логистической регрессии, если мы используем функцию стоимости линейной регрессии, то она закончится нелинейным выпуклым графом, который бесполезен и будет иметь много локальных минимумов.
Функция стоимости логистической регрессии:
И график выглядит так 👇
Вывод:
Спасибо, что читаете мой блог, мне очень приятно🙏. Я надеюсь, что этот блог поможет вам понять логистическую регрессию.