Статьи по теме random-forest

Публикации по теме 'random-forest'

Прогнозирование ущерба от землетрясений с помощью машинного обучения — Часть 3

Автор — Джен Ненг Нг Эта история является продолжением серии: Часть 1: Фоновое исследование Часть 2: Анализ данных Часть 3: Реализация Часть 4: Реализация (продолжение) Часть 3. Реализация Разделение данных В результате разделения данных был создан набор данных поезда из 146 590 строк и набор тестовых данных из 36 506 строк. Очистка данных Используйте коробочную диаграмму, чтобы обрезать выброс: Выборка данных Мы можем проверить..

Вопрос интервью AirBnb Data Science

Между линейной регрессией и регрессией случайного леса, какая модель будет работать лучше и почему? Давайте сначала быстро объясним различия между линейной и случайной регрессией леса, прежде чем углубляться в то, какой из них лучше всего подходит для бронирования. Регрессия случайного леса основана на технике группового машинного обучения по бэггингу . Две ключевые концепции случайных лесов: Случайная выборка обучающих наблюдений при построении деревьев. Случайные подмножества..

Прогнозирование результатов футбола с помощью случайного леса

Прогнозирование результатов футбола с помощью случайного леса Обзор проекта Ставки на футбол существуют с момента изобретения футбола в 19 веке. Он присутствует в рекламных роликах, в качестве спонсоров команд или в букмекерских конторах за углом (по крайней мере, в Германии). Тем не менее, я думаю, что хорошо разбираюсь в реальных футбольных тенденциях, отлично разбираюсь в крупнейших лигах Европы и знаю большинство игроков моих любимых команд (Боруссия Дортмунд и Герта Берлин), я..

Прогнозирование дохода > 50 000 долларов на основе данных переписи с использованием моделирования случайного леса

Прогнозирование дохода ›50 000 долл. США по данным переписи с использованием моделирования случайного леса Сценарий: Мелисса Девлин , Джоуи Ромнесс , Рик Пирс Данные переписи населения США, использованные в этом моделировании, содержат +32 тыс. записей и 14 признаков. Мы исследовали, очистили и преобразовали данные, чтобы они соответствовали моделированию случайного леса. Цель этого упражнения по моделированию состоит в том, чтобы предсказать, что человек заработает более 50..

Когда требуется обрезка регрессора дерева решений

Хотя у нас есть множество регрессоров для прогнозирования / аппроксимации целевых переменных, не всегда более продвинутые из них выигрывают. В этой статье делается попытка показать, что Регрессор дерева решений (DTR) выигрывает у продвинутых, таких как Random Forest и т. Д. Мы попытались сравнить DTR со следующими регрессорами: Линейный регрессор Усиленный регрессор ADABoost Случайные леса Каждый регрессор был опробован индивидуально, чтобы найти его лучший результат , а затем..