Come eseguire un test di durbin-watson in r
Uno dei presupposti chiave della regressione lineare è che non vi sia alcuna correlazione tra i residui, ovvero che i residui siano indipendenti.
Un modo per determinare se questa ipotesi è soddisfatta è eseguire un test di Durbin-Watson , utilizzato per rilevare la presenza di autocorrelazione nei residui di una regressione. Questo test utilizza le seguenti ipotesi:
H 0 (ipotesi nulla): non esiste correlazione tra i residui.
H A (ipotesi alternativa): i residui sono autocorrelati.
Questo tutorial spiega come eseguire un test di Durbin-Watson in R.
Esempio: test di Durbin-Watson in R
Per eseguire un test di Durbin-Watson, dobbiamo prima adattare un modello di regressione lineare. Utilizzeremo il set di dati R integrato di mtcars e adatteremo un modello di regressione utilizzando mpg come variabile predittiva e disp e wt come variabili esplicative.
#load mtcars dataset data(mtcars) #view first six rows of dataset head(mtcars) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1 #fit regression model model <- lm(mpg ~ disp+wt, data=mtcars)
Quindi possiamo eseguire un test Durbin-Watson utilizzando la funzione durbinWatsonTest() dal pacchetto perché :
#load car package library(car) #perform Durbin-Watson test durbinWatsonTest(model) Loading required package: carData lag Autocorrelation DW Statistic p-value 1 0.341622 1.276569 0.034 Alternative hypothesis: rho != 0
Dal risultato, possiamo vedere che la statistica del test è 1.276569 e il corrispondente valore p è 0.034 . Poiché questo valore p è inferiore a 0,05, possiamo rifiutare l’ipotesi nulla e concludere che i residui di questo modello di regressione sono autocorrelati.
Cosa fare se viene rilevata l’autocorrelazione
Se rifiuti l’ipotesi nulla e concludi che nei residui è presente l’autocorrelazione, hai diverse opzioni per correggere questo problema se lo consideri abbastanza serio:
- Per una correlazione seriale positiva, prendere in considerazione l’aggiunta di ritardi della variabile dipendente e/o indipendente al modello.
- Per la correlazione seriale negativa, assicurati che nessuna delle variabili abbia un ritardo eccessivo .
- Per la correlazione stagionale, prendere in considerazione l’aggiunta di dummy stagionali al modello.