Это может показаться глупым вопросом, но мне было интересно, почему медиана из median
и медиана из survfit
(пакет выживания) различаются
Я попытался смоделировать учебник на sciencing.com:
Составьте список времени выживания всех субъектов в вашей выборке. Например, если у вас пять студентов (в реальном исследовании у вас было бы больше), и их время до окончания школы составляло 3 года, 4 года (пока), 4,5 года, 3,5 года и 7 лет (пока), напишите вниз: 3, 4, 4,5, 3,5, 7.
Поместите знак плюса (или другой знак) рядом с любым временем, которое подвергается цензуре справа (то есть тем, в которых событие еще не произошло). Ваш список будет выглядеть так: 3, 4+, 4.5, 3.5, 7+.
Итак, я создал data.frame (T
для мертвых и F
для живых):
survive <- data.frame(OS = c(3,4,4.5,3.5,7), status = c(T,F,T,T,F))
медиана равна 4, как говорится на сайте sciencing.com:
median(survive$OS)
[1] 4
но когда я провожу анализ выживаемости с помощью пакета выживания, я получаю следующее:
Call: survfit(formula = Surv(OS, status) ~ 1, data = survive)
n events median 0.95LCL 0.95UCL
5.0 3.0 4.5 3.5 NA
Итак, мой вопрос: почему эти две медианы разные?
Благодарность