So führen sie einen wald-test in r durch


Mit einem Wald-Test kann getestet werden, ob ein oder mehrere Parameter eines Modells bestimmten Werten entsprechen.

Dieser Test wird häufig verwendet, um zu bestimmen, ob eine oder mehrere Prädiktorvariablen in einem Regressionsmodell gleich Null sind.

Für diesen Test verwenden wir die folgenden Null- und Alternativhypothesen :

  • H 0 : Einige Sätze von Prädiktorvariablen sind alle gleich Null.
  • H A : Nicht alle Prädiktorvariablen im Satz sind gleich Null.

Wenn wir die Nullhypothese nicht ablehnen können, können wir den angegebenen Satz von Prädiktorvariablen aus dem Modell entfernen, da sie keine statistisch signifikante Verbesserung der Modellanpassung bewirken.

Das folgende Beispiel zeigt, wie ein Wald-Test in R durchgeführt wird.

Beispiel: Wald-Test in R

Für dieses Beispiel verwenden wir den in R integrierten mtcars- Datensatz, um das folgende multiple lineare Regressionsmodell anzupassen:

mpg = β 0 + β 1 verfügbar + β 2 Kohlenhydrate + β 3 PS + β 4 Zyl

Der folgende Code zeigt, wie dieses Regressionsmodell angepasst und die Modellzusammenfassung angezeigt wird:

 #fit regression model
model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-5.0761 -1.5752 -0.2051 1.0745 6.3047 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 34.021595 2.523397 13.482 1.65e-13 ***
available -0.026906 0.011309 -2.379 0.0247 *  
carb -0.926863 0.578882 -1.601 0.1210    
hp 0.009349 0.020701 0.452 0.6551    
cyl -1.048523 0.783910 -1.338 0.1922    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.973 on 27 degrees of freedom
Multiple R-squared: 0.788, Adjusted R-squared: 0.7566 
F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09

Als nächstes können wir die Funktion wald.test() aus dem aod -Paket verwenden, um zu testen, ob die Regressionskoeffizienten für die Prädiktorvariablen „hp“ und „cyl“ beide gleich Null sind.

Diese Funktion verwendet die folgende grundlegende Syntax:

wald.test(Sigma, b, Terme)

Gold:

  • Sigma : Die Varianz-Kovarianz-Matrix des Regressionsmodells
  • b : Ein Vektor der Regressionskoeffizienten des Modells
  • Begriffe : Ein Vektor, der die zu testenden Koeffizienten angibt

Der folgende Code zeigt, wie man diese Funktion in der Praxis nutzt:

 library (aod)

#perform Wald Test to determine if 3rd and 4th predictor variables are both zero
wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4)

Wald test:
----------

Chi-squared test:
X2 = 3.6, df = 2, P(>X2) = 0.16

Aus dem Ergebnis können wir ersehen, dass der p-Wert des Tests 0,16 beträgt.

Da dieser p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese des Wald-Tests nicht ablehnen.

Das bedeutet, dass wir davon ausgehen können, dass die Regressionskoeffizienten für die Prädiktorvariablen „hp“ und „cyl“ beide gleich Null sind.

Wir können diese Terme aus dem Modell entfernen, da sie die Gesamtanpassung des Modells statistisch nicht signifikant verbessern.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in R ausgeführt werden:

So führen Sie eine einfache lineare Regression in R durch
So führen Sie eine multiple lineare Regression in R durch
So interpretieren Sie die Regressionsausgabe in R
So berechnen Sie den Varianzinflationsfaktor (VIF) in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert