Comment effectuer un test Durbin-Watson dans R
L’une des hypothèses clés de la régression linéaire est qu’il n’y a pas de corrélation entre les résidus, c’est-à-dire que les résidus sont indépendants.
Une façon de déterminer si cette hypothèse est remplie consiste à effectuer un test de Durbin-Watson , qui est utilisé pour détecter la présence d’autocorrélation dans les résidus d’une régression. Ce test utilise les hypothèses suivantes :
H 0 (hypothèse nulle) : Il n’y a pas de corrélation entre les résidus.
H A (hypothèse alternative) : Les résidus sont autocorrélés.
Ce tutoriel explique comment effectuer un test Durbin-Watson dans R.
Exemple : test de Durbin-Watson dans R
Pour effectuer un test de Durbin-Watson, nous devons d’abord ajuster un modèle de régression linéaire. Nous utiliserons l’ensemble de données R intégré mtcars et ajusterons un modèle de régression en utilisant mpg comme variable prédictive et disp et wt comme variables explicatives.
#load mtcars dataset data(mtcars) #view first six rows of dataset head(mtcars) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1 #fit regression model model <- lm(mpg ~ disp+wt, data=mtcars)
Ensuite, nous pouvons effectuer un test Durbin-Watson en utilisant la fonction durbinWatsonTest() du package car :
#load car package library(car) #perform Durbin-Watson test durbinWatsonTest(model) Loading required package: carData lag Autocorrelation D-W Statistic p-value 1 0.341622 1.276569 0.034 Alternative hypothesis: rho != 0
À partir du résultat, nous pouvons voir que la statistique de test est 1,276569 et la valeur p correspondante est 0,034 . Puisque cette valeur p est inférieure à 0,05, nous pouvons rejeter l’hypothèse nulle et conclure que les résidus de ce modèle de régression sont autocorrélés.
Que faire si une autocorrélation est détectée
Si vous rejetez l’hypothèse nulle et concluez qu’une autocorrélation est présente dans les résidus, vous disposez alors de plusieurs options pour corriger ce problème si vous le jugez suffisamment grave :
- Pour une corrélation en série positive, envisagez d’ajouter des décalages de la variable dépendante et/ou indépendante au modèle.
- Pour une corrélation série négative, assurez-vous qu’aucune de vos variables n’est surdifférée .
- Pour la corrélation saisonnière, envisagez d’ajouter des variables fictives saisonnières au modèle.