Прогноз с помощью survreg/tobit выходит за границы

Поэтому я использую survreg и ожидаю, что мои прогнозируемые результаты будут соответствовать нижней границе 0, но они часто указывают на отрицательные результаты. Я думаю, что это каким-то образом оценивает линейный результат, а не модель выживания, которую я пытаюсь создать. Вот что я сделал:

linear.first.stage<-lm(y ~ x, data=clip)

Сначала я прикинул несколько баллов, чтобы ускорить процесс оценки. Он не может сходиться без этой первой стадии. Я создаю объект выживания, следуя коду из ?survreg, который предоставляет явный пример тобитной регрессии. Я продублировал это ниже для x и y. В моем наборе данных y можно наблюдать только при неотрицательном значении, но если оно положительное, то имеет тенденцию к нормальному распределению около 200 или около того с sd около 20. X может принимать любое значение и теоретически не связано любым номером, который сразу приходит на ум.

surv_y<-Surv(clip$y, clip$y>0,type="left")
first.stage<-survreg(surv_y ~ x,init=(linear.first.stage), dist="gaussian", data=clip)

Я запускаю регрессию выживания, которая должна быть эквивалентна Тобиту. Чтобы подтвердить, что моя интерпретация событий была такой же, я выполнил следующее:

test<-tobit(y~x, left=0, right=Inf, dist="gaussian", data=clip)
p_test<-predict(test)
p<-predict(first.stage)
plot(p_test-p)

На графике показана ровная линия на нуле, поэтому при визуальном осмотре эти команды идентичны, как и должно быть. Однако в обоих случаях предсказываются результаты ниже 0. Это проблематично, потому что я заявил, что левая граница наблюдаемой информации равна 0. Я ожидаю, что все предсказанные значения должны быть> 0.

Я пытался предсказать, используя типы «ссылка», «ответ», «линейный», но безрезультатно. Я предполагаю, что команда прогнозирования выдает результаты, как если бы цензуры не было. Как создать прогноз, который соответствует нижней границе 0?

Рекомендации:

  1. Выполнение прогноза() после tobit() в пакете AER
  2. https://stats.stackexchange.com/questions/11440/standardized-residuals-of-a-tobit-model-in-r

person RegressForward    schedule 07.04.2013    source источник
comment
Можете ли вы объяснить конструкцию объекта Surv? event определяется clip$y >0. Так почему бы не сделать некоторые прогнозы отрицательными? (Я тоже не очень понимаю, как эта конструкция имеет смысл. Определение события на основе времени наблюдения просто кажется неправильным. Обычно нужно, чтобы процесс выживания и цензурирования был более независимым, чем это.)   -  person IRTFM    schedule 08.04.2013
comment
Я не уверен, что понимаю ваш комментарий о времени наблюдения - я знаком только с использованием Тобитом этой регрессии. Возможно, я неправильно понимаю применение surreg? Я попытался уточнить выше.   -  person RegressForward    schedule 08.04.2013
comment
Я запускал то же самое, используя стандартную команду Tobit, поэтому, как минимум, я не запутался в том, как здесь работает синтаксис команды. Y в данном случае не является длительностью. Вместо этого y — это что-то вроде заработной платы (которая не может опускаться ниже 0), а x — это что-то вроде уровня образования, который является фактором занятости/зарплаты.   -  person RegressForward    schedule 08.04.2013
comment
Если вы измените тип dist на gaussian, вы должны ожидать, что «ответ» и «линейный предиктор» будут одинаковыми. Вы делаете оценку в своем случае на усеченном наборе данных, который концептуально немного отличается от цензурированного набора данных, поэтому наша терминология, вероятно, не используется. Коммуникация может быть улучшена, если вы предложите код для имитации вашей ситуации с данными. Я знаю, что «survreg» находится в пакете survial, но я только предполагаю, что функция «tobit», которую вы использовали, находится в пакете AER.   -  person IRTFM    schedule 08.04.2013
comment
Это отвечает на мой вопрос: Tobit — неправильный тип регрессии для использования здесь, следовательно, мои забавные результаты. Спасибо.   -  person RegressForward    schedule 08.04.2013
comment
Вероятно, вам следует ответить на свой вопрос (а не оставлять резолюцию в качестве комментария)   -  person etov    schedule 12.05.2014


Ответы (2)


Вероятно, вам нужно масштабировать прогноз в том смысле, который описан здесь одним из авторы пакета.

person Richard    schedule 04.05.2015

Ответ: Тобит не является правильным типом регрессии. Тобит предсказывает, каким должен быть результат в отсутствие усечения.

Уточнение: я реструктурировал свой процесс оценки, чтобы отразить модель с нулевым завышением или барьером. Tobit предназначен для цензурированных данных, он говорит, что существует ненулевой результат, но мы наблюдаем только 0, потому что информация каким-то образом скрыта. Например, заработная плата женщин должна соответствовать Товиту, потому что замужние женщины, решившие не работать, по-прежнему имеют резервную заработную плату и все еще имеют некоторую (невидимую) отдачу от усилий, выполняя неоплачиваемый труд любого типа. Нулевые или барьерные модели показывают, что результат действительно нулевой. То есть никаких преступлений не было. Или никакие виджеты не производятся. Они более точно отражали мою модель.

person RegressForward    schedule 19.06.2014
comment
Не могли бы вы уточнить свой ответ? Если Товит предсказывает, что должно быть в отсутствие усечения (не знал, что...), то что надо использовать для предсказания с усечением? Спасибо! - person Matifou; 07.11.2014
comment
Я реструктурировал свой процесс оценки, чтобы отразить модель с нулевым завышением или барьерной моделью. Tobit предназначен для цензурированных данных, он говорит, что существует ненулевой результат, но мы наблюдаем только 0, потому что информация каким-то образом скрыта. Например, заработная плата женщин должна соответствовать Товиту, потому что замужние женщины, решившие не работать, по-прежнему имеют резервную заработную плату и все еще имеют некоторую (невидимую) отдачу от усилий, выполняя неоплачиваемый труд любого типа. Нулевые или барьерные модели показывают, что результат действительно нулевой. То есть никаких преступлений не было. Или никакие виджеты не производятся. Они более точно отражали мою модель. - person RegressForward; 27.03.2015