Как выполнить тест вальда в r
Тест Вальда можно использовать для проверки того, равны ли один или несколько параметров модели определенным значениям.
Этот тест часто используется для определения того, равны ли нулю одна или несколько переменных-предикторов в регрессионной модели .
Для этого теста мы используем следующие нулевые и альтернативные гипотезы :
- H 0 : Некоторые наборы переменных-предикторов равны нулю.
- H A : Не все переменные-предикторы в наборе равны нулю.
Если нам не удастся отвергнуть нулевую гипотезу, мы можем удалить из модели указанный набор переменных-предикторов, поскольку они не обеспечивают статистически значимого улучшения соответствия модели.
В следующем примере показано, как выполнить тест Вальда в R.
Пример: тест Вальда в R
В этом примере мы будем использовать набор данных mtcars , встроенный в R, чтобы соответствовать следующей модели множественной линейной регрессии:
миль на галлон = β 0 + β 1 доступный + β 2 карбюратор + β 3 л.с. + β 4 цил.
Следующий код показывает, как подогнать эту модель регрессии и отобразить сводную информацию о модели:
#fit regression model model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.0761 -1.5752 -0.2051 1.0745 6.3047 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 34.021595 2.523397 13.482 1.65e-13 *** available -0.026906 0.011309 -2.379 0.0247 * carb -0.926863 0.578882 -1.601 0.1210 hp 0.009349 0.020701 0.452 0.6551 cyl -1.048523 0.783910 -1.338 0.1922 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.973 on 27 degrees of freedom Multiple R-squared: 0.788, Adjusted R-squared: 0.7566 F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09
Далее мы можем использовать функцию wald.test() из пакета aod , чтобы проверить, равны ли нулю коэффициенты регрессии для переменных-предикторов «hp» и «cyl».
Эта функция использует следующий базовый синтаксис:
wald.test(Сигма, б, Условия)
Золото:
- Сигма : дисперсионно-ковариационная матрица регрессионной модели.
- b : Вектор коэффициентов регрессии модели.
- Термины : вектор, который определяет коэффициенты для проверки.
Следующий код показывает, как использовать эту функцию на практике:
library (aod) #perform Wald Test to determine if 3rd and 4th predictor variables are both zero wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4) Wald test: ---------- Chi-squared test: X2 = 3.6, df = 2, P(>X2) = 0.16
Из результата мы видим, что значение p теста составляет 0,16.
Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу теста Вальда.
Это означает, что мы можем предположить, что коэффициенты регрессии для переменных-предикторов «hp» и «cyl» равны нулю.
Мы можем удалить эти условия из модели, поскольку они статистически значимо не улучшают общую точность модели.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в R:
Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как интерпретировать результаты регрессии в R
Как рассчитать коэффициент инфляции дисперсии (VIF) в R