Я пытаюсь выполнить t-тест с двумя выборками, чтобы проверить, есть ли значительная разница в среднем между двумя наборами данных.
У меня есть два набора данных, и каждый набор данных имеет 5 испытаний, и каждое испытание имеет 3 функции. Каждая пробная версия имеет свою уникальную метку, но 3 функции (X1, X2, X3 одинаковы для всех). В каждом отдельном испытании мы измеряем 3 функции, и значения измерений отображаются ниже. Я пытаюсь рассчитать среднюю разницу для каждой функции в обоих наборах данных.
Вот как выглядят мои данные, когда я получаю их из SQL.
Набор данных 1:
T1 X1 0.93
T1 X2 0.3
T1 X3 -2.9
T2 X1 1.3
T2 X2 0.8
T2 X3 1.9
T3 X1 2.3
T3 X2 -1.8
T3 X3 0.9
T4 X1 0.3
T4 X2 0.8
T4 X3 0.9
T5 X1 0.3
T5 X2 0.8
T5 X3 0.9
Набор данных 2:
T10 X1 1.3
T10 X2 -2.8
T10 X3 0.09
T11 X1 3.3
T11 X2 0.8
T11 X3 1.9
T12 X1 0.3
T12 X2 -4.8
T12 X3 2.9
T13 X1 1.3
T13 X2 2.8
T13 X3 0.19
T14 X1 2.3
T14 X2 0.08
T14 X3 -0.9
Вот как я хочу, чтобы мой вывод выглядел, где я хочу, чтобы ttest применялся к каждой функции, чтобы я мог получить значение p для каждой функции.
Feature Mean-DataSET1 Mean-DataSET2 P-value
X1
X2
X3
когда я делаю stats.ttest_ind(set1['value'], set2['value']).pvalue , я получаю одно единственное pvalue
Спасибо!
set1
илиset2
и какова их форма? Выглядят ли они точно так же, как данные в форме массива? - person amzon-ex   schedule 19.05.2020