Come eseguire il test del bianco in r (con esempi)
Il test di White viene utilizzato per determinare se l’eteroschedasticità è presente in un modello di regressione.
L’eteroschedasticità si riferisce alla dispersione non uniforme dei residui a diversi livelli di una variabile di risposta in un modello di regressione, che viola uno dei presupposti chiave della regressione lineare secondo cui i residui sono equamente dispersi a ciascun livello della variabile di risposta.
Questo tutorial spiega come eseguire il test di White in R per determinare se l’eteroschedasticità è o meno un problema in un dato modello di regressione.
Esempio: test del bianco in R
In questo esempio, adatteremo un modello di regressione lineare multipla utilizzando il set di dati R integrato di mtcars.
Una volta adattato il modello, utilizzeremo la funzione bptest della libreria lmtest per eseguire il test di White per determinare se è presente l’eteroschedasticità.
Passaggio 1: adattare un modello di regressione.
Innanzitutto, adatteremo un modello di regressione utilizzando mpg come variabile di risposta e disp e hp come due variabili esplicative.
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Passaggio 2: eseguire il test di White.
Successivamente, utilizzeremo la seguente sintassi per eseguire il test di White per determinare se è presente l’eteroschedasticità:
#load lmtest library library(lmtest) #perform White's test bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars) studentized Breusch-Pagan test data: model BP = 7.0766, df = 5, p-value = 0.215
Ecco come interpretare il risultato:
- La statistica del test è X2 = 7.0766 .
- I gradi di libertà sono 5 .
- Il valore p corrispondente è 0,215 .
Il test di White utilizza le seguenti ipotesi nulle e alternative:
- Nullo (H 0 ) : è presente l’omoschedasticità.
- Alternativa ( HA ): è presente eteroschedasticità.
Poiché il valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Non abbiamo prove sufficienti per affermare che l’eteroschedasticità sia presente nel modello di regressione.
Cosa fare dopo
Se non si riesce a rifiutare l’ipotesi nulla del test di White, l’eteroschedasticità non è presente e si può procedere a interpretare il risultato della regressione originale.
Tuttavia, se si rifiuta l’ipotesi nulla, significa che nei dati è presente l’eteroschedasticità. In questo caso, gli errori standard visualizzati nella tabella di output della regressione potrebbero essere inaffidabili.
Esistono diversi modi comuni per risolvere questo problema, tra cui:
1. Trasformare la variabile di risposta.
Puoi provare a eseguire una trasformazione sulla variabile di risposta, ad esempio prendendo il logaritmo, la radice quadrata o la radice cubica della variabile di risposta. In generale, ciò può far scomparire l’eteroschedasticità.
2. Utilizzare la regressione ponderata.
La regressione ponderata assegna un peso a ciascun punto dati in base alla varianza del relativo valore adattato. In sostanza, ciò attribuisce pesi bassi ai punti dati che presentano varianze più elevate, riducendo i loro quadrati residui. Quando vengono utilizzati i pesi appropriati, ciò può eliminare il problema dell’eteroschedasticità.