Публикации по теме 'random-forest'
Прогнозирование ущерба от землетрясений с помощью машинного обучения — Часть 3
Автор — Джен Ненг Нг
Эта история является продолжением серии:
Часть 1: Фоновое исследование
Часть 2: Анализ данных
Часть 3: Реализация
Часть 4: Реализация (продолжение)
Часть 3. Реализация
Разделение данных
В результате разделения данных был создан набор данных поезда из 146 590 строк и набор тестовых данных из 36 506 строк.
Очистка данных
Используйте коробочную диаграмму, чтобы обрезать выброс:
Выборка данных
Мы можем проверить..
Вопрос интервью AirBnb Data Science
Между линейной регрессией и регрессией случайного леса, какая модель будет работать лучше и почему?
Давайте сначала быстро объясним различия между линейной и случайной регрессией леса, прежде чем углубляться в то, какой из них лучше всего подходит для бронирования.
Регрессия случайного леса основана на технике группового машинного обучения по бэггингу . Две ключевые концепции случайных лесов:
Случайная выборка обучающих наблюдений при построении деревьев. Случайные подмножества..
Прогнозирование результатов футбола с помощью случайного леса
Прогнозирование результатов футбола с помощью случайного леса
Обзор проекта
Ставки на футбол существуют с момента изобретения футбола в 19 веке. Он присутствует в рекламных роликах, в качестве спонсоров команд или в букмекерских конторах за углом (по крайней мере, в Германии). Тем не менее, я думаю, что хорошо разбираюсь в реальных футбольных тенденциях, отлично разбираюсь в крупнейших лигах Европы и знаю большинство игроков моих любимых команд (Боруссия Дортмунд и Герта Берлин), я..
Прогнозирование дохода > 50 000 долларов на основе данных переписи с использованием моделирования случайного леса
Прогнозирование дохода ›50 000 долл. США по данным переписи с использованием моделирования случайного леса
Сценарий: Мелисса Девлин , Джоуи Ромнесс , Рик Пирс
Данные переписи населения США, использованные в этом моделировании, содержат +32 тыс. записей и 14 признаков. Мы исследовали, очистили и преобразовали данные, чтобы они соответствовали моделированию случайного леса.
Цель этого упражнения по моделированию состоит в том, чтобы предсказать, что человек заработает более 50..
Когда требуется обрезка регрессора дерева решений
Хотя у нас есть множество регрессоров для прогнозирования / аппроксимации целевых переменных, не всегда более продвинутые из них выигрывают. В этой статье делается попытка показать, что Регрессор дерева решений (DTR) выигрывает у продвинутых, таких как Random Forest и т. Д.
Мы попытались сравнить DTR со следующими регрессорами:
Линейный регрессор Усиленный регрессор ADABoost Случайные леса
Каждый регрессор был опробован индивидуально, чтобы найти его лучший результат , а затем..