Hoe white's test in r uit te voeren (met voorbeelden)


De test van White wordt gebruikt om te bepalen of heteroscedasticiteit aanwezig is in een regressiemodel.

Heteroscedasticiteit verwijst naar de ongelijke spreiding van residuen op verschillende niveaus van eenresponsvariabele in een regressiemodel, wat in strijd is met een van de belangrijkste aannames van lineaire regressie dat residuen gelijkmatig verspreid zijn op elk niveau van de responsvariabele.

In deze tutorial wordt uitgelegd hoe u de White-test in R kunt uitvoeren om te bepalen of heteroscedasticiteit al dan niet een probleem is in een bepaald regressiemodel.

Voorbeeld: Wittest in R

In dit voorbeeld passen we een meervoudig lineair regressiemodel toe met behulp van de ingebouwde R-dataset van mtcars.

Zodra we het model hebben aangepast, zullen we de bptest- functie uit de lmtest- bibliotheek gebruiken om de White-test uit te voeren om te bepalen of heteroscedasticiteit aanwezig is.

Stap 1: Pas een regressiemodel toe.

Eerst passen we een regressiemodel aan met mpg als responsvariabele en disp en hp als twee verklarende variabelen.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Stap 2: Voer de test van White uit.

Vervolgens zullen we de volgende syntaxis gebruiken om de test van White uit te voeren om te bepalen of heteroscedasticiteit aanwezig is:

 #load lmtest library
library(lmtest)

#perform White's test
bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars)

	studentized Breusch-Pagan test

data: model
BP = 7.0766, df = 5, p-value = 0.215

Zo interpreteert u het resultaat:

  • De teststatistiek is X2 = 7,0766 .
  • De vrijheidsgraden zijn 5 .
  • De overeenkomstige p-waarde is 0,215 .

De Witte test gebruikt de volgende nul- en alternatieve hypothesen:

  • Nul (H 0 ) : Homoskedasticiteit is aanwezig.
  • Alternatief ( HA ): Er is heteroskedasticiteit aanwezig.

Omdat de p-waarde niet kleiner is dan 0,05, slagen we er niet in de nulhypothese te verwerpen. We hebben niet voldoende bewijs om te beweren dat heteroskedasticiteit aanwezig is in het regressiemodel.

Wat nu te doen

Als u er niet in slaagt de nulhypothese van White’s test te verwerpen, is er geen sprake van heteroskedasticiteit en kunt u doorgaan met het interpreteren van het resultaat van de oorspronkelijke regressie.

Als u echter de nulhypothese verwerpt, betekent dit dat er heteroskedasticiteit aanwezig is in de gegevens. In dit geval zijn de standaardfouten die in de regressie-uitvoertabel worden weergegeven mogelijk onbetrouwbaar.

Er zijn verschillende veelvoorkomende manieren om dit probleem op te lossen, waaronder:

1. Transformeer de responsvariabele.

U kunt proberen een transformatie uit te voeren op de responsvariabele, bijvoorbeeld door de log-, vierkantswortel of derdemachtswortel van de responsvariabele te nemen. Over het algemeen kan dit ertoe leiden dat heteroscedasticiteit verdwijnt.

2. Gebruik gewogen regressie.

Gewogen regressie kent een gewicht toe aan elk gegevenspunt op basis van de variantie van de aangepaste waarde. In wezen geeft dit een laag gewicht aan datapunten met hogere varianties, waardoor hun resterende kwadraten kleiner worden. Wanneer de juiste gewichten worden gebruikt, kan dit het probleem van heteroscedasticiteit elimineren.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert