Come eseguire il test del bianco in r (con esempi)


Il test di White viene utilizzato per determinare se l’eteroschedasticità è presente in un modello di regressione.

L’eteroschedasticità si riferisce alla dispersione non uniforme dei residui a diversi livelli di una variabile di risposta in un modello di regressione, che viola uno dei presupposti chiave della regressione lineare secondo cui i residui sono equamente dispersi a ciascun livello della variabile di risposta.

Questo tutorial spiega come eseguire il test di White in R per determinare se l’eteroschedasticità è o meno un problema in un dato modello di regressione.

Esempio: test del bianco in R

In questo esempio, adatteremo un modello di regressione lineare multipla utilizzando il set di dati R integrato di mtcars.

Una volta adattato il modello, utilizzeremo la funzione bptest della libreria lmtest per eseguire il test di White per determinare se è presente l’eteroschedasticità.

Passaggio 1: adattare un modello di regressione.

Innanzitutto, adatteremo un modello di regressione utilizzando mpg come variabile di risposta e disp e hp come due variabili esplicative.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Passaggio 2: eseguire il test di White.

Successivamente, utilizzeremo la seguente sintassi per eseguire il test di White per determinare se è presente l’eteroschedasticità:

 #load lmtest library
library(lmtest)

#perform White's test
bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars)

	studentized Breusch-Pagan test

data: model
BP = 7.0766, df = 5, p-value = 0.215

Ecco come interpretare il risultato:

  • La statistica del test è X2 = 7.0766 .
  • I gradi di libertà sono 5 .
  • Il valore p corrispondente è 0,215 .

Il test di White utilizza le seguenti ipotesi nulle e alternative:

  • Nullo (H 0 ) : è presente l’omoschedasticità.
  • Alternativa ( HA ): è presente eteroschedasticità.

Poiché il valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Non abbiamo prove sufficienti per affermare che l’eteroschedasticità sia presente nel modello di regressione.

Cosa fare dopo

Se non si riesce a rifiutare l’ipotesi nulla del test di White, l’eteroschedasticità non è presente e si può procedere a interpretare il risultato della regressione originale.

Tuttavia, se si rifiuta l’ipotesi nulla, significa che nei dati è presente l’eteroschedasticità. In questo caso, gli errori standard visualizzati nella tabella di output della regressione potrebbero essere inaffidabili.

Esistono diversi modi comuni per risolvere questo problema, tra cui:

1. Trasformare la variabile di risposta.

Puoi provare a eseguire una trasformazione sulla variabile di risposta, ad esempio prendendo il logaritmo, la radice quadrata o la radice cubica della variabile di risposta. In generale, ciò può far scomparire l’eteroschedasticità.

2. Utilizzare la regressione ponderata.

La regressione ponderata assegna un peso a ciascun punto dati in base alla varianza del relativo valore adattato. In sostanza, ciò attribuisce pesi bassi ai punti dati che presentano varianze più elevate, riducendo i loro quadrati residui. Quando vengono utilizzati i pesi appropriati, ciò può eliminare il problema dell’eteroschedasticità.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *