Как выполнить тест вальда в r


Тест Вальда можно использовать для проверки того, равны ли один или несколько параметров модели определенным значениям.

Этот тест часто используется для определения того, равны ли нулю одна или несколько переменных-предикторов в регрессионной модели .

Для этого теста мы используем следующие нулевые и альтернативные гипотезы :

  • H 0 : Некоторые наборы переменных-предикторов равны нулю.
  • H A : Не все переменные-предикторы в наборе равны нулю.

Если нам не удастся отвергнуть нулевую гипотезу, мы можем удалить из модели указанный набор переменных-предикторов, поскольку они не обеспечивают статистически значимого улучшения соответствия модели.

В следующем примере показано, как выполнить тест Вальда в R.

Пример: тест Вальда в R

В этом примере мы будем использовать набор данных mtcars , встроенный в R, чтобы соответствовать следующей модели множественной линейной регрессии:

миль на галлон = β 0 + β 1 доступный + β 2 карбюратор + β 3 л.с. + β 4 цил.

Следующий код показывает, как подогнать эту модель регрессии и отобразить сводную информацию о модели:

 #fit regression model
model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-5.0761 -1.5752 -0.2051 1.0745 6.3047 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 34.021595 2.523397 13.482 1.65e-13 ***
available -0.026906 0.011309 -2.379 0.0247 *  
carb -0.926863 0.578882 -1.601 0.1210    
hp 0.009349 0.020701 0.452 0.6551    
cyl -1.048523 0.783910 -1.338 0.1922    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.973 on 27 degrees of freedom
Multiple R-squared: 0.788, Adjusted R-squared: 0.7566 
F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09

Далее мы можем использовать функцию wald.test() из пакета aod , чтобы проверить, равны ли нулю коэффициенты регрессии для переменных-предикторов «hp» и «cyl».

Эта функция использует следующий базовый синтаксис:

wald.test(Сигма, б, Условия)

Золото:

  • Сигма : дисперсионно-ковариационная матрица регрессионной модели.
  • b : Вектор коэффициентов регрессии модели.
  • Термины : вектор, который определяет коэффициенты для проверки.

Следующий код показывает, как использовать эту функцию на практике:

 library (aod)

#perform Wald Test to determine if 3rd and 4th predictor variables are both zero
wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4)

Wald test:
----------

Chi-squared test:
X2 = 3.6, df = 2, P(>X2) = 0.16

Из результата мы видим, что значение p теста составляет 0,16.

Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу теста Вальда.

Это означает, что мы можем предположить, что коэффициенты регрессии для переменных-предикторов «hp» и «cyl» равны нулю.

Мы можем удалить эти условия из модели, поскольку они статистически значимо не улучшают общую точность модели.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в R:

Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как интерпретировать результаты регрессии в R
Как рассчитать коэффициент инфляции дисперсии (VIF) в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *