Как использовать все возможности rpart?

Я использую пакет rpart для классификации дерева решений. У меня есть фрейм данных с примерно 4000 функциями (столбцами). Я хочу использовать все функции rpart() для своей модели. Как я могу это сделать? По сути, rpart() попросит меня использовать эту функцию следующим образом:

dt <- rpart(class ~ feature1 + feature2 + ....)

Мои функции — это слова в документах, поэтому у меня более 4 тыс. функций. Каждая функция представлена ​​словом. Есть ли возможность использовать все функции, не прописывая их?


person user3430235    schedule 23.09.2014    source источник


Ответы (2)


Я понял:

dt <- rpart(class ~ ., data)

"." представляет все функции.

person user3430235    schedule 23.09.2014

Библиотека caret действительно полезна, потому что вы можете легко применять разные модели и сравнивать их производительность. Он может вызывать rpart, но использует немного другой синтаксис для включения всех функций.

library(caret)

library(data.table)

mt <- data.table(mtcars)

tr <- train(x=mt[,-'hp', with=FALSE], y = mt[, hp], method='rpart')

plot(tr$finalModel)
text(tr$finalModel)

Использование всех 4000 функций для дерева решений может привести к переоснащению, особенно если количество наблюдений невелико. Caret обеспечивает встроенную перекрестную проверку. Вы также можете посмотреть model='rf' для случайных лесов.

person C8H10N4O2    schedule 19.12.2015