Come eseguire un test breusch-pagan in sas
Un test di Breusch-Pagan viene utilizzato per determinare se l’eteroschedasticità è presente in un’analisi di regressione.
Questo tutorial spiega come eseguire un test Breusch-Pagan in SAS.
Esempio: test Breusch-Pagan in SAS
Supponiamo di voler adattare un modello di regressione lineare multipla che utilizzi il numero di ore trascorse a studiare e il numero di esami pratici sostenuti per prevedere il voto dell’esame finale degli studenti:
Punteggio esame = β 0 + β 1 (ore) + β 2 (esami preparatori)
Innanzitutto, utilizzeremo il seguente codice per creare un set di dati contenente queste informazioni per 20 studenti:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 90 5 4 90 3 4 82 4 4 85 6 5 90 2 1 83 1 0 62 2 1 76 ; run ; /*view dataset*/ proc print data =exam_data;
Successivamente, utilizzeremo il modello proc per adattare questo modello di regressione lineare multipla, nonché l’affermazione pagana per eseguire il test di Breusch-Pagan per l’eteroschedasticità:
/*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
parms a1 b1 b2;
score = a1 + b1*hours + b2*prep_exams;
fit score / pagan=(1 hours prep_exams)
out =resid1 outsid ;
run ;
quit ;
L’ultima tabella dei risultati mostra i risultati del test di Breusch-Pagan.
Da questa tabella possiamo vedere che la statistica del test è 5,05 e il corrispondente valore p è 0,0803 .
Poiché il valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla.
Ciò significa che non abbiamo prove sufficienti per affermare che l’eteroschedasticità è presente nel modello di regressione.
È quindi possibile interpretare con sicurezza gli errori standard delle stime dei coefficienti nella tabella riepilogativa della regressione.
Cosa fare dopo
Se non si rifiuta l’ipotesi nulla del test di Breusch-Pagan, l’eteroschedasticità non è presente e si può procedere a interpretare il risultato della regressione originale.
Tuttavia, se si rifiuta l’ipotesi nulla, significa che nei dati è presente l’eteroschedasticità. In questo caso, gli errori standard visualizzati nella tabella di output della regressione potrebbero essere inaffidabili.
Esistono diversi modi comuni per risolvere questo problema, tra cui:
1. Trasformare la variabile di risposta. Puoi provare a eseguire una trasformazione sulla variabile di risposta.
Ad esempio, puoi utilizzare la variabile di risposta del log invece della variabile di risposta originale.
In generale , prendere il logaritmo della variabile di risposta è un modo efficace per rimuovere l’eteroschedasticità.
Un’altra trasformazione comune consiste nell’utilizzare la radice quadrata della variabile di risposta.
2. Utilizzare la regressione ponderata. Questo tipo di regressione assegna un peso a ciascun punto dati in base alla varianza del relativo valore adattato.
Ciò assegna piccoli pesi ai punti dati che presentano varianze più elevate, riducendo i loro quadrati residui.
Quando vengono utilizzati i pesi appropriati, ciò può eliminare il problema dell’eteroschedasticità.