Jak wykonać test walda w r


Test Walda można zastosować do sprawdzenia, czy jeden lub więcej parametrów modelu ma określone wartości.

Test ten jest często używany do określenia, czy jedna lub więcej zmiennych predykcyjnych w modelu regresji jest równych zero.

W tym teście używamy następujących hipotez zerowych i alternatywnych:

  • H 0 : Wszystkie zestawy zmiennych predykcyjnych są równe zeru.
  • H A : Nie wszystkie zmienne predykcyjne w zestawie są równe zeru.

Jeżeli nie odrzucimy hipotezy zerowej, wówczas możemy usunąć z modelu określony zestaw zmiennych predykcyjnych, gdyż nie zapewniają one statystycznie istotnej poprawy dopasowania modelu.

Poniższy przykład pokazuje, jak wykonać test Walda w R.

Przykład: test Walda w R

W tym przykładzie użyjemy zbioru danych mtcars wbudowanego w R, aby dopasować go do następującego modelu regresji liniowej wielokrotnej:

mpg = β 0 + β 1 dostępne + β 2 węglowodany + β 3 KM + β 4 cyl

Poniższy kod pokazuje, jak dopasować ten model regresji i wyświetlić podsumowanie modelu:

 #fit regression model
model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-5.0761 -1.5752 -0.2051 1.0745 6.3047 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 34.021595 2.523397 13.482 1.65e-13 ***
available -0.026906 0.011309 -2.379 0.0247 *  
carb -0.926863 0.578882 -1.601 0.1210    
hp 0.009349 0.020701 0.452 0.6551    
cyl -1.048523 0.783910 -1.338 0.1922    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.973 on 27 degrees of freedom
Multiple R-squared: 0.788, Adjusted R-squared: 0.7566 
F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09

Następnie możemy użyć funkcji wald.test() z pakietu aod , aby sprawdzić, czy współczynniki regresji dla zmiennych predykcyjnych „hp” i „cyl” są równe zero.

Ta funkcja wykorzystuje następującą podstawową składnię:

wald.test(Sigma, b, Warunki)

Złoto:

  • Sigma : Macierz wariancji-kowariancji modelu regresji
  • b : Wektor współczynników regresji modelu
  • Warunki : wektor określający współczynniki do testowania

Poniższy kod pokazuje, jak w praktyce wykorzystać tę funkcję:

 library (aod)

#perform Wald Test to determine if 3rd and 4th predictor variables are both zero
wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4)

Wald test:
----------

Chi-squared test:
X2 = 3.6, df = 2, P(>X2) = 0.16

Z wyniku widzimy, że wartość p testu wynosi 0,16.

Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej testu Walda.

Oznacza to, że możemy założyć, że współczynniki regresji dla zmiennych predykcyjnych „hp” i „cyl” są równe zero.

Możemy usunąć te terminy z modelu, ponieważ nie poprawiają one statystycznie znacząco ogólnego dopasowania modelu.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w języku R:

Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R
Jak interpretować wynik regresji w R
Jak obliczyć współczynnik inflacji wariancji (VIF) w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *