Hoe een wald-test uit te voeren in r
Met een Wald-test kan worden getest of één of meerdere parameters van een model gelijk zijn aan bepaalde waarden.
Deze test wordt vaak gebruikt om te bepalen of een of meer voorspellende variabelen in een regressiemodel gelijk zijn aan nul.
Voor deze test gebruiken we de volgende nul- en alternatieve hypothesen :
- H 0 : Sommige sets voorspellende variabelen zijn allemaal gelijk aan nul.
- H A : Niet alle voorspellende variabelen in de set zijn gelijk aan nul.
Als we er niet in slagen de nulhypothese te verwerpen, kunnen we de gespecificeerde reeks voorspellende variabelen uit het model verwijderen, omdat deze geen statistisch significante verbetering in de modelfit opleveren.
In het volgende voorbeeld ziet u hoe u een Wald-test uitvoert in R.
Voorbeeld: Wald-test in R
Voor dit voorbeeld gebruiken we de mtcars- gegevensset die in R is ingebouwd om in het volgende meervoudige lineaire regressiemodel te passen:
mpg = β 0 + β 1 beschikbaar + β 2 carb + β 3 pk + β 4 cil
De volgende code laat zien hoe dit regressiemodel moet worden aangepast en hoe het modeloverzicht kan worden weergegeven:
#fit regression model model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.0761 -1.5752 -0.2051 1.0745 6.3047 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 34.021595 2.523397 13.482 1.65e-13 *** available -0.026906 0.011309 -2.379 0.0247 * carb -0.926863 0.578882 -1.601 0.1210 hp 0.009349 0.020701 0.452 0.6551 cyl -1.048523 0.783910 -1.338 0.1922 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.973 on 27 degrees of freedom Multiple R-squared: 0.788, Adjusted R-squared: 0.7566 F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09
Vervolgens kunnen we de functie wald.test() uit het aod- pakket gebruiken om te testen of de regressiecoëfficiënten voor de voorspellende variabelen „hp“ en „cyl“ beide gelijk zijn aan nul.
Deze functie gebruikt de volgende basissyntaxis:
wald.test(Sigma, b, voorwaarden)
Goud:
- Sigma : de variantie-covariantiematrix van het regressiemodel
- b : Een vector van regressiecoëfficiënten van het model
- Termen : Een vector die de te testen coëfficiënten specificeert
De volgende code laat zien hoe u deze functie in de praktijk kunt gebruiken:
library (aod) #perform Wald Test to determine if 3rd and 4th predictor variables are both zero wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4) Wald test: ---------- Chi-squared test: X2 = 3.6, df = 2, P(>X2) = 0.16
Uit het resultaat kunnen we zien dat de p-waarde van de test 0,16 is.
Omdat deze p-waarde niet kleiner is dan 0,05, slagen we er niet in de nulhypothese van de Wald-test te verwerpen.
Dit betekent dat we kunnen aannemen dat de regressiecoëfficiënten voor de voorspellende variabelen “hp” en “cyl” beide gelijk zijn aan nul.
We kunnen deze termen uit het model verwijderen omdat ze de algehele fit van het model niet statistisch significant verbeteren.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in R uitvoert:
Hoe eenvoudige lineaire regressie uit te voeren in R
Hoe meervoudige lineaire regressie uit te voeren in R
Hoe regressie-uitvoer in R te interpreteren
Hoe de variantie-inflatiefactor (VIF) in R te berekenen