Поэтому я использую survreg и ожидаю, что мои прогнозируемые результаты будут соответствовать нижней границе 0, но они часто указывают на отрицательные результаты. Я думаю, что это каким-то образом оценивает линейный результат, а не модель выживания, которую я пытаюсь создать. Вот что я сделал:
linear.first.stage<-lm(y ~ x, data=clip)
Сначала я прикинул несколько баллов, чтобы ускорить процесс оценки. Он не может сходиться без этой первой стадии. Я создаю объект выживания, следуя коду из ?survreg, который предоставляет явный пример тобитной регрессии. Я продублировал это ниже для x и y. В моем наборе данных y можно наблюдать только при неотрицательном значении, но если оно положительное, то имеет тенденцию к нормальному распределению около 200 или около того с sd около 20. X может принимать любое значение и теоретически не связано любым номером, который сразу приходит на ум.
surv_y<-Surv(clip$y, clip$y>0,type="left")
first.stage<-survreg(surv_y ~ x,init=(linear.first.stage), dist="gaussian", data=clip)
Я запускаю регрессию выживания, которая должна быть эквивалентна Тобиту. Чтобы подтвердить, что моя интерпретация событий была такой же, я выполнил следующее:
test<-tobit(y~x, left=0, right=Inf, dist="gaussian", data=clip)
p_test<-predict(test)
p<-predict(first.stage)
plot(p_test-p)
На графике показана ровная линия на нуле, поэтому при визуальном осмотре эти команды идентичны, как и должно быть. Однако в обоих случаях предсказываются результаты ниже 0. Это проблематично, потому что я заявил, что левая граница наблюдаемой информации равна 0. Я ожидаю, что все предсказанные значения должны быть> 0.
Я пытался предсказать, используя типы «ссылка», «ответ», «линейный», но безрезультатно. Я предполагаю, что команда прогнозирования выдает результаты, как если бы цензуры не было. Как создать прогноз, который соответствует нижней границе 0?
Рекомендации:
Surv
?event
определяетсяclip$y >0
. Так почему бы не сделать некоторые прогнозы отрицательными? (Я тоже не очень понимаю, как эта конструкция имеет смысл. Определение события на основе времени наблюдения просто кажется неправильным. Обычно нужно, чтобы процесс выживания и цензурирования был более независимым, чем это.) - person IRTFM   schedule 08.04.2013