newdata при построении кривой выживаемости регрессии Кокса в r

Я пытаюсь построить скорректированную кривую выживаемости, построив регрессию Кокса при использовании переменных взаимодействий.

читая страницу Survfit.coxph https://stat.ethz.ch/R-manual/R-devel/library/survival/html/survfit.coxph.html я вижу параметр "newdata"

newdata 
a data frame with the same variable names as those that appear in the coxph formula. It is also valid to use a vector, if the data frame would consist of a single row.

The curve(s) produced will be representative of a cohort whose covariates correspond to the values in newdata. Default is the mean of the covariates used in the coxph fit.

Где я хочу построить линии в моем выводе cox, которые являются взаимодействиями. То есть, если мой вывод cox выглядит так:

                    coef exp(coef) se(coef)      z       p
 Drug2           -0.1345     0.876   0.1812 -0.732 4.5e-01
 Drug3           -0.3678     0.719   0.0816 -3.966 7.2e-05
 Drug4            0.0468     1.063   0.0432  0.932 3.4e-01
 Sex              0.2574     1.294   0.0786  3.133 1.2e-03
 Sex:Drug2       -0.1283     0.880   0.1809 -0.709 4.8e-01
 Sex:Drug3       -0.3226     0.724   0.0817 -3.950 7.8e-05
 Sex:Drug4        0.0524     1.054   0.0574  0.913 3.6e-01

Я хочу построить новые кривые выживаемости для моей переменной «Препарат» после взаимодействия с Sex.

Это приводит меня к этому параметру newdata.

В чем разница в том, чтобы не включать newdata и просто использовать среднее значение ковариат, по сравнению с вызовом newdata. На данный момент я даже не знаю, как правильно построить новые данные.

Если кто-нибудь может дать мне какие-либо указания о том, как я буду строить newdata на основе моей модели Кокса, и каково это значение по сравнению с простым использованием среднего. Я должен ожидать такого же количества линий в моей исходной кривой выживаемости при построении этого нового графика выживаемости, основанного на данных Кокса.


person brucezepplin    schedule 30.11.2015    source источник


Ответы (1)


У вас по-прежнему будет скорректированная средняя выживаемость в качестве неявной «базовой кривой выживаемости», но кривые, основанные на новых данных, будут иметь отношение рисков, смещенное от 1,0 на коэффициент exp (coef). Вы вводите значения, которые представляют функции, для которых вы хотите получить оценки, а функция expand.grid создаст все двухсторонние комбинации ковариат. Непонятно, как вы смоделировали пол, но из выходных данных видно, что это числовой, а не множитель, и я предполагаю, что существует разница в одну единицу. Пытаться:

plot( survfit( my.fit, newdata=expand.grid(Sex=c(1,2), drug=factor(1:4) ) ) )
person IRTFM    schedule 30.11.2015
comment
Благодарю. Можно ли только построить график обновленных функций лекарств. когда я вызываю Survift и рисую его, он включает в себя выровненные для двух полов, которых я не хочу. - person brucezepplin; 01.12.2015
comment
Если у вас есть модель, которая включает секс во взаимодействии с наркотиками, вам нужно посмотреть на прогнозы для каждого пола отдельно, поскольку она будет давать разные результаты для каждого пола. Вы можете построить график только для одного пола, но он будет отображать только половину полного ответа. - person IRTFM; 01.12.2015