первый плакат здесь, так что извиняюсь за ошибки новичка
Я использую пакет каретки в R. Я подбираю некоторые модели (GBM, linear SVM, NB, LDA), используя повторную 10-кратную перекрестную проверку на обучающем наборе. Используя настраиваемый trainControl, caret даже дает мне целый ряд показателей производительности модели, таких как ROC, Spec / sens, Kappa, Accuracy по тестовым складкам. Это действительно фантастика. Есть еще одна метрика, которую я хотел бы иметь: некоторая мера калибровки модели.
Я заметил, что внутри курсора есть функция, которая может создайте калибровочный график, чтобы оценить согласованность производительности модели по частям ваших данных. Возможно ли, чтобы каретка вычисляла это для каждой тестовой свертки во время построения модели с перекрестной проверкой? Или это можно применить только к некоторым новым имеющимся данным, на основании которых мы делаем прогнозы?
Для некоторого контекста на данный момент у меня есть что-то вроде этого:
fitControl <- trainControl(method = "repeatedcv", repeats=2, number = 10, classProbs = TRUE, summaryFunction = custom.summary)
gbmGrid <- expand.grid(.interaction.depth = c(1,2,3),.n.trees = seq(100,800,by=100),.shrinkage = c(0.01))
gbmModel <- train(y= train_target, x = data.frame(t_train_predictors),
method = "gbm",
trControl = fitControl,
tuneGrid = gbmGrid,
verbose = FALSE)
Если это помогает, я использую ~ 25 числовых предикторов и N = 2200, предсказывая фактор с двумя классами.
Большое спасибо за любую помощь / совет. Адам