У нас просто есть несколько встроенных функций в SQL Server для выполнения сложного статистического анализа, но мне нужно вычислить множественную линейную регрессию в TSQL.
Основываясь на этом сообщении (функция множественной линейной регрессии в SQL Server), Я мог бы получить Coefficients
за Intercept (Y)
, X1
и X2
.
Мне нужно p-value
для X1
и X2
, а также R Square
Тестовые данные:
DECLARE @TestData TABLE (i INT IDENTITY(1, 1), X1 FLOAT, X2 FLOAT, y FLOAT)
INSERT @TestData
SELECT 0, 17, 210872.3034 UNION ALL
SELECT 0, 23, 191988.2299 UNION ALL
SELECT 0, 18, 204564.9455 UNION ALL
SELECT 0, 4, 189528.9212 UNION ALL
SELECT 0, 0, 200203.6364 UNION ALL
SELECT 11, 0, 218814.1701 UNION ALL
SELECT 5, 0, 220109.2129 UNION ALL
SELECT 2, 0, 214377.8534 UNION ALL
SELECT 1, 0, 204926.9208 UNION ALL
SELECT 0, 0, 202499.4065 UNION ALL
SELECT 0, 3, 196917.8182 UNION ALL
SELECT 0, 9, 202286.0012
Желаемый результат:
R Square 0.4991599183412360
p-value X1 0.0264247876580807
p-value X2 0.7817597643898020
Я уже смог получить следующие данные из приведенных выше тестовых данных.
b Coefficients
----------------------------------
Intercept (Y) 202119.231151577
X1 C(H) 1992.8421941724
X2 C(C) -83.8561622730127
Я знаю, что TSQL не является хорошей платформой для этого, но мне нужно, чтобы это было сделано исключительно в TSQL.
Мне известно о Пакеты функций XLeratorDB для SQL Server