Я пытаюсь использовать R для запуска t-теста студента и теста хи-квадрат с большими наборами данных. Поскольку я новичок в R, моя неопытность не позволяет мне добиться большого успеха в моем собственном коде.
В обоих наборах данных отсутствуют данные, и они выглядят примерно так:
AA assayX activity assayY1 activity assayY2 activity
chemical 1 TRUE 0 12.2
chemical 2 TRUE 0
chemical 3 45.2 35.6
chemical 4 FALSE 0 0
AB assayX activity assayY1 activity assayY2 activity
chemical 1 TRUE FALSE TRUE
chemical 2 TRUE FALSE
chemical 3 TRUE TRUE
chemical 4 FALSE FALSE FALSE
Поскольку это большой набор данных, я пытаюсь создать код, в котором я могу сравнить assayX со всеми assayY. Я надеюсь создать цикл t-теста студента для первого набора данных и цикл хи-квадрат для второго набора данных. Ранее мне удавалось создавать код цикла для корреляционного анализа, поэтому я основывал свой код на этой идее.
x<- na.omit(mydata1[, c(assayX)])
y<- na.omit(mydata1[, c(assayY1:assayYend)])
lapply(y, function(x)t.test(y~x))
x<-na.omit(mydata2[, c(assayX)])
y<- na.omit(mydata2[, c(assayY1:assayYend)]
lapply(y, x=x, chisq.test)
Проблема с первым кодом: недопустимая переменная y
Проблема со вторым кодом: x и y должны иметь одинаковую длину.
Я немного поправил кое-где и получил разные типы ошибок, например, недостаточное количество «y» наблюдений и так далее. Я в основном использовал этот сайт, чтобы выяснить, как работает R, поэтому я надеюсь, что вы, ребята, найдете маленькое умное решение для новичка.