Здесь данные Бангалора из Kaggle используются для прогнозирования цен на жилье с помощью алгоритмов машинного обучения, таких как регрессия, регрессия keras, и в конце строится обобщенная модель.
Почему регресс?
Регрессия — это процесс прогнозирования непрерывной ценности. следовательно, зависимое или прогнозируемое значение должно быть непрерывным, а не дискретным.
Здесь мы можем наблюдать за набором данных и определить, что значение цены должно быть предсказано, и оно является непрерывным.
С помощью линейной регрессии мы добились точности 85%. мы можем сравнить результаты с помощью морского сюжета.
Ниже приведены различные меры точности:
Регрессия Кераса
Keras – это API, используемый для запуска высокоуровневых нейронных сетей. Модель работает поверх Tensor Flow и была разработана Google.
В этом конкретном примере нейронная сеть будет построена в Keras для решения задачи регрессии, то есть той, где наша зависимая переменная (y) имеет интервальный формат, и мы пытаемся предсказать количество y с максимально возможной точностью.
Что такое нейронная сеть?
Введение Получение данных Управление данными Визуализация данных Основная статистика Регрессионные модели Расширенное моделирование Программирование Советы и рекомендации Видеоуроки
Примечание. С тех пор эта статья была обновлена. Более свежие и актуальные результаты можно найти по адресу: Нейронные сети на основе регрессии: прогнозирование среднесуточных ставок для отелей.
Keras – это API, используемый для запуска высокоуровневых нейронных сетей. Модель работает поверх TensorFlow и была разработана Google.
Основным конкурентом Keras на данный момент является PyTorch, разработанный Facebook. Хотя PyTorch имеет несколько более высокий уровень поддержки сообщества, это особенно многословный язык, и я лично предпочитаю Keras из-за большей простоты и легкости использования при создании и развертывании моделей.
В этом конкретном примере нейронная сеть будет построена в Keras для решения задачи регрессии, то есть той, где наша зависимая переменная (y) имеет интервальный формат, и мы пытаемся предсказать количество y с максимально возможной точностью.
Что такое нейронная сеть?
Нейронная сеть — это вычислительная система, которая создает прогнозы на основе существующих данных.
Нейронная сеть состоит из:
- Входные слои: слои, принимающие входные данные на основе существующих данных.
- Скрытые слои. Слои, использующие обратное распространение для оптимизации весов входных переменных с целью повышения прогностической способности модели.
- Выходные слои: вывод прогнозов на основе данных из входных и скрытых слоев.
Во-первых, мы импортируем наши библиотеки. Обратите внимание, что вам потребуется установить TensorFlow в вашей системе, чтобы иметь возможность выполнять приведенный ниже код. Теперь мы обучаем нейронную сеть. Мы используем 245 входных переменных (sqft, bhk, Bath, Locations (с одним горячим кодированием)), а также два скрытых слоя из 500 500 и 500 нейронов соответственно, и наконец, используя функцию активации Rectified Linear (ReLu) для обработки вывода. mean_squared_error (mse) — это наша функция потерь.
с помощью нейросети также мы добились точности 85%
Теперь модель и набор функций, т. е. столбцы, экспортируются на нашу локальную машину в виде pickle и json соответственно.
Поскольку это сквозной проект, мы будем использовать эту информацию в качестве бэкэнда на веб-сайте для прогнозирования цен. популярными примерами таких веб-сайтов являются Magicbricks, Ghardekho и многие другие.
мы использовали сервер enginx и с помощью экземпляра amazon aws ec2 для размещения веб-сайта. показан следующий вывод
Исходный код и ссылка на git hub для следующего сквозного проекта перечислены ниже.
https://github.com/kananiarpan/HOUSE-PRICE-PREDICTION-WITH-REGRESSION-TECHNIQUES.git