R coxph() с термином взаимодействия, предупреждение: матрица X считается сингулярной

Пожалуйста, будьте терпеливы со мной. Я новичок на этом сайте.

Я моделирую выживание черепашьего гнезда с помощью функции coxph() и столкнулся с запутанной проблемой с термином взаимодействия между видами и клетками гнезда. У меня есть гнезда от 3-х видов черепах (7, 10 и 111 гнезд на вид).

Гнездовые клетки есть на всех гнездах для вида(1) с 7 гнездами.

На всех гнездах вида (2) с 10 гнездами отсутствуют гнездовые клетки.

Гнездовые клетки есть примерно на половине гнезд для вида (3) со 111 гнездами.

Вот моя модель с итоговым выводом:

    S<-Surv(time, event)

    n8<-coxph(S~species:cage, data=nesta1)
    Warning message:
    In coxph(S ~ species:cage, data = nesta1) :
      X matrix deemed to be singular; variable 1 5 6

    summary(n8)

    Call:
    coxph(formula = S ~ species:cage, data = nesta1)

      n= 128, number of events= 73 

                         coef exp(coef) se(coef)      z Pr(>|z|)   
    species1:cageN      NA        NA   0.0000     NA       NA   
    species2:cageN  1.2399    3.4554   0.3965  3.128  0.00176 **
    species3:cageN  0.5511    1.7351   0.2664  2.068  0.03860 * 
    species1:cageY -0.1054    0.8999   0.6145 -0.172  0.86379   
    species2:cageY      NA        NA   0.0000     NA       NA   
    species3:cageY      NA        NA   0.0000     NA       NA   
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

                      exp(coef) exp(-coef) lower .95 upper .95
    species1:cageN        NA         NA        NA        NA
    species2:cageN    3.4554     0.2894    1.5887     7.515
    species3:cageN    1.7351     0.5763    1.0293     2.925
    species1:cageY    0.8999     1.1112    0.2698     3.001
    species2:cageY        NA         NA        NA        NA
    species3:cageY        NA         NA        NA        NA

    Concordance= 0.61  (se = 0.038 )
    Rsquare= 0.079   (max possible= 0.993 )
    Likelihood ratio test= 10.57  on 3 df,   p=0.01426
    Wald test            = 11.36  on 3 df,   p=0.009908
    Score (logrank) test = 12.22  on 3 df,   p=0.006672

Я понимаю, что у меня будут особенности для видов 1 и 2, но не для вида 3. Почему строка «species3:cageY» должна быть единственной, когда есть гнезда вида 3 с гнездовыми клетками на них? Можно ли включить виды 1 и 2, даже если у них есть эти особенности?

Изменить: я не могу найти никаких ошибок в своих данных. У меня есть десятичные числа для переменной времени для нескольких гнезд, но это не проблема для гнезд вида 3 без гнездовой клетки. Для вида 3 у меня есть полный диапазон значений времени для гнезд с гнездовой клеткой и без нее, а также есть как истинные, так и ложные события для гнезд с гнездовой клеткой и без нее.

Редактировать: с (nesta1, таблица (событие, вид, клетка))

      , , cage = N

           species
    event    1    2    3
        0    0    1   24
        1    0    9   38

    , , cage = Y

         species
    event    1    2    3
        0    4    0   26
        1    3    0   23

Редактировать 2: я понимаю, что модели только для взаимодействия не очень полезны, но результаты термина взаимодействия ведут себя одинаково, независимо от того, есть ли у меня другие основные эффекты в модели или нет. Я удалил другие основные эффекты, чтобы упростить этот вопрос.

Спасибо!


person Hannah Mccurdy-Adams    schedule 22.03.2016    source источник
comment
Опубликовать результаты with( nesta1 , table(event, species, cage)). Как правило, модели построения только с условиями взаимодействия и без основных эффектов приводят к математическим катастрофам, управляемым данными.   -  person IRTFM    schedule 05.04.2016
comment
У меня была большая модель с другими основными эффектами, и я получил те же результаты. Я сократил модель в этом вопросе, чтобы попытаться упростить ее. Я добавил результаты, о которых вы просили, но я не уверен, что они означают.   -  person Hannah Mccurdy-Adams    schedule 06.04.2016
comment
Пункт 1 должен заключаться в том, что модели, основанные только на взаимодействии, обычно являются пустой тратой времени, потому что их очень трудно интерпретировать. Если вы не уверены, что они означают, это не удивительно, так как большинство людей тоже не понимают. Обычно они не соответствуют интересным гипотезам. Я не уверен, что мне нужно идти к пункту 2, учитывая пункт 1. С моей шляпой MD я говорю, что если это больно, когда вы крутите свой программный путь таким образом, ну тогда .... не делайте этого.   -  person IRTFM    schedule 06.04.2016
comment
Я понимаю, что модели только для взаимодействия бесполезны, но я сделал это только для взаимодействия, чтобы упростить свой вопрос. Используя AIC, все мои лучшие модели включали термин взаимодействия, а также другие переменные. Результаты взаимодействия ведут себя так же с другими переменными в модели, поэтому я удалил их для простоты для этого вопроса. Я думаю, что понимаю, что означает это взаимодействие для видов 1 и 2. Меня смущает вид 3, потому что есть гнезда с клетками и без них, но результаты показывают NA). Я думал, что контролирую вариацию, добавляя термин взаимодействия.   -  person Hannah Mccurdy-Adams    schedule 09.04.2016