Comment effectuer un test de Breusch-Pagan dans R

Par Dr. Benjamin Anderson juillet 29, 2023 Guide 0 commentaire

Un test de Breusch-Pagan est utilisé pour déterminer si l’hétéroscédasticité est présente dans une analyse de régression.

Ce tutoriel explique comment effectuer un test de Breusch-Pagan dans R.

Exemple : test de Breusch-Pagan dans R

Dans cet exemple, nous allons ajuster un modèle de régression à l’aide de l’ensemble de données R intégré mtcars , puis effectuer un test de Breusch-Pagan à l’aide de la fonction bptest de la bibliothèque lmtest pour déterminer si une hétéroscédasticité est présente.

Étape 1 : Ajustez un modèle de régression.

Tout d’abord, nous ajusterons un modèle de régression en utilisant mpg comme variable de réponse et disp et hp comme deux variables explicatives.

#load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904   1.331566  23.083  < 2e-16 ***
disp        -0.030346   0.007405  -4.098 0.000306 ***
hp          -0.024840   0.013385  -1.856 0.073679 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared:  0.7482,	Adjusted R-squared:  0.7309 
F-statistic: 43.09 on 2 and 29 DF,  p-value: 2.062e-09

Étape 2 : Effectuez un test de Breusch-Pagan.

Ensuite, nous effectuerons un test de Breusch-Pagan pour déterminer si une hétéroscédasticité est présente.

#load lmtest library
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data:  model
BP = 4.0861, df = 2, p-value = 0.1296

La statistique du test est de 4,0861 et la valeur p correspondante est de 0,1296 . Puisque la valeur p n’est pas inférieure à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Nous ne disposons pas de preuves suffisantes pour affirmer que l’hétéroscédasticité est présente dans le modèle de régression.

Que faire ensuite

Si vous ne parvenez pas à rejeter l’hypothèse nulle du test de Breusch-Pagan, alors l’hétéroscédasticité n’est pas présente et vous pouvez procéder à l’interprétation du résultat de la régression originale.

Cependant, si vous rejetez l’hypothèse nulle, cela signifie qu’une hétéroscédasticité est présente dans les données. Dans ce cas, les erreurs types affichées dans le tableau de sortie de la régression peuvent ne pas être fiables.

Il existe plusieurs manières courantes de résoudre ce problème, notamment :

1. Transformez la variable de réponse. Vous pouvez essayer d’effectuer une transformation sur la variable de réponse. Par exemple, vous pouvez utiliser le journal de la variable de réponse au lieu de la variable de réponse d’origine. Généralement, prendre le log de la variable de réponse est un moyen efficace de faire disparaître l’hétéroscédasticité. Une autre transformation courante consiste à utiliser la racine carrée de la variable de réponse.

2. Utilisez la régression pondérée. Ce type de régression attribue un poids à chaque point de données en fonction de la variance de sa valeur ajustée. Essentiellement, cela donne de faibles poids aux points de données qui ont des variances plus élevées, ce qui réduit leurs carrés résiduels. Lorsque les pondérations appropriées sont utilisées, cela peut éliminer le problème de l’hétéroscédasticité.

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus