Як виконати тест вальда в r


Тест Вальда можна використовувати, щоб перевірити, чи дорівнюють один або кілька параметрів моделі певним значенням.

Цей тест часто використовується, щоб визначити, чи дорівнюють нулю одна або кілька змінних предиктора в регресійній моделі .

Для цього тесту ми використовуємо такі нульові та альтернативні гіпотези :

  • H 0 : деякі набори змінних предикторів дорівнюють нулю.
  • H A : Не всі змінні предиктора в наборі дорівнюють нулю.

Якщо нам не вдасться відхилити нульову гіпотезу, ми можемо видалити вказаний набір предикторних змінних із моделі, оскільки вони не забезпечують статистично значущого покращення відповідності моделі.

У наступному прикладі показано, як виконати перевірку Вальда в R.

Приклад: тест Вальда в R

У цьому прикладі ми використаємо набір даних mtcars , вбудований у R, щоб відповідати такій моделі множинної лінійної регресії:

mpg = β 0 + β 1 доступний + β 2 вуглеводів + β 3 к.с. + β 4 цил.

Наступний код показує, як підібрати цю регресійну модель і відобразити зведення моделі:

 #fit regression model
model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-5.0761 -1.5752 -0.2051 1.0745 6.3047 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 34.021595 2.523397 13.482 1.65e-13 ***
available -0.026906 0.011309 -2.379 0.0247 *  
carb -0.926863 0.578882 -1.601 0.1210    
hp 0.009349 0.020701 0.452 0.6551    
cyl -1.048523 0.783910 -1.338 0.1922    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.973 on 27 degrees of freedom
Multiple R-squared: 0.788, Adjusted R-squared: 0.7566 
F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09

Далі ми можемо використати функцію wald.test() із пакету aod , щоб перевірити, чи дорівнюють нулю коефіцієнти регресії для змінних предиктора «hp» і «cyl».

Ця функція використовує такий базовий синтаксис:

wald.test(Sigma, b, Терміни)

золото:

  • Сигма : Матриця дисперсії-коваріації регресійної моделі
  • b : вектор коефіцієнтів регресії моделі
  • Терміни : вектор, який визначає коефіцієнти для перевірки

Наступний код показує, як використовувати цю функцію на практиці:

 library (aod)

#perform Wald Test to determine if 3rd and 4th predictor variables are both zero
wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4)

Wald test:
----------

Chi-squared test:
X2 = 3.6, df = 2, P(>X2) = 0.16

З результату ми бачимо, що p-значення тесту становить 0,16.

Оскільки це p-значення не менше ніж 0,05, ми не можемо відхилити нульову гіпотезу тесту Вальда.

Це означає, що ми можемо припустити, що коефіцієнти регресії для змінних предиктора «hp» і «cyl» дорівнюють нулю.

Ми можемо видалити ці терміни з моделі, оскільки вони статистично суттєво не покращують загальну відповідність моделі.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в R:

Як виконати просту лінійну регресію в R
Як виконати множинну лінійну регресію в R
Як інтерпретувати результат регресії в R
Як розрахувати фактор інфляції дисперсії (VIF) у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *