Come eseguire un test di breusch-pagan in r


Un test di Breusch-Pagan viene utilizzato per determinare se l’eteroschedasticità è presente in un’analisi di regressione.

Questo tutorial spiega come eseguire un test di Breusch-Pagan in R.

Esempio: test di Breusch-Pagan in R

In questo esempio, adatteremo un modello di regressione utilizzando il set di dati R integrato di mtcars , quindi eseguiremo un test di Breusch-Pagan utilizzando la funzione bptest della libreria lmtest per determinare se è presente eteroschedasticità.

Passaggio 1: adattare un modello di regressione.

Innanzitutto, adatteremo un modello di regressione utilizzando mpg come variabile di risposta e disp e hp come due variabili esplicative.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Passaggio 2: eseguire un test di Breusch-Pagan.

Successivamente, eseguiremo un test di Breusch-Pagan per determinare se è presente eteroschedasticità.

 #load lmtest library
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 4.0861, df = 2, p-value = 0.1296

La statistica del test è 4,0861 e il corrispondente valore p è 0,1296 . Poiché il valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Non abbiamo prove sufficienti per affermare che l’eteroschedasticità sia presente nel modello di regressione.

Cosa fare dopo

Se non si rifiuta l’ipotesi nulla del test di Breusch-Pagan, l’eteroschedasticità non è presente e si può procedere a interpretare il risultato della regressione originale.

Tuttavia, se si rifiuta l’ipotesi nulla, significa che nei dati è presente l’eteroschedasticità. In questo caso, gli errori standard visualizzati nella tabella di output della regressione potrebbero essere inaffidabili.

Esistono diversi modi comuni per risolvere questo problema, tra cui:

1. Trasformare la variabile di risposta. Puoi provare a eseguire una trasformazione sulla variabile di risposta. Ad esempio, puoi utilizzare la variabile di risposta del log invece della variabile di risposta originale. In generale, prendere il logaritmo della variabile di risposta è un modo efficace per eliminare l’eteroschedasticità. Un’altra trasformazione comune consiste nell’utilizzare la radice quadrata della variabile di risposta.

2. Utilizzare la regressione ponderata. Questo tipo di regressione assegna un peso a ciascun punto dati in base alla varianza del relativo valore adattato. In sostanza, ciò attribuisce pesi bassi ai punti dati che presentano varianze più elevate, riducendo i loro quadrati residui. Quando vengono utilizzati i pesi appropriati, ciò può eliminare il problema dell’eteroschedasticità.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *