Пошаговое руководство с использованием базовых библиотек

В своей первой статье о Medium я собираюсь объяснить, как реализовать простую линейную регрессию с использованием Python без scikit-learn.

В этом примере я использовал некоторые базовые библиотеки, такие как pandas, numpy и matplotlib, чтобы получить набор данных, решить уравнения и визуализировать данные соответственно. .

Вы можете найти набор данных для этого примера в репозитории GitHub.

К коду

Давайте посмотрим на следующий код:

Как видите, я создал класс regression, используя соответствующий метод, и для простоты я использовал базовые образцы данных в x и y.

Первый метод в классе находит сумму списка с мощностью. Если вы знаете, как найти коэффициент регрессии на бумаге, это не должно быть проблемой для вас.

Как только мы получим сумму, нам нужно создать два уравнения, поскольку мы используем метод наименьших квадратов.

Для решения уравнений я использовал linalg.solve метод numpy. Мы возвращаем одну константу, которая используется для получения значения x в тестовом наборе данных. Чтобы решить уравнение, этот метод вернет список из двух неизвестных a и b в y = a * x + b.

Использование метода predict создаст список с именем y_pred, в котором перечислены предсказанные значения значений, которые были переданы в качестве теста.

Наконец, метод main применяет все методы, которые я использовал, и строит график. Точки красного цвета показывают фактические значения, а синяя линия показывает прогнозируемые значения.

Заключение

Надеюсь, вам понравилась эта работа. Если у вас есть вопросы или комментарии, оставьте их ниже!

Спасибо за чтение!

Также ознакомьтесь с другими моими статьями о Системе рекомендаций и развертывании моделей машинного обучения.