Текстовая модель дерева решений rpart, как подавить длинный список значений в каждом разделенном узле

Я создаю модель дерева решений со всеми категориальными переменными. Некоторые из этих категориальных переменных имеют более 100 возможных значений.

Вот мой код:

model = rpart(score ~., data = dataset);
plot(model)
text(model)

Проблема в том, что text(model) аннотирует каждый разделяемый узел длинным списком значений соответствующей категориальной переменной. И ценности втиснуты друг в друга и на них тяжело смотреть. Я ищу вариант для text(model), чтобы отображать только имя переменной и подавлять все значения. Таким образом, по крайней мере, построенное дерево будет ясным и покажет, какая переменная используется в каждом узле.

Заранее спасибо!

Лео


person user1369206    schedule 06.08.2013    source источник


Ответы (1)


Функция prp в rpart.plot может помочь ?

Существует несколько вариантов построения различных макетов дерева, и вы можете сократить уровни разделения, используя команду faclen.

Что-то вроде;

library(rpart.plot)
model = rpart(score ~., data = dataset)

prp(model, faclen = 2)

Может помочь навести порядок. (Примечание: установка для faclen значения 1 означает, что каждому факторному уровню будет присвоена одна буква в алфавитном порядке).

person Adam Kimberley    schedule 09.08.2013