Come eseguire un test breusch-pagan in sas


Un test di Breusch-Pagan viene utilizzato per determinare se l’eteroschedasticità è presente in un’analisi di regressione.

Questo tutorial spiega come eseguire un test Breusch-Pagan in SAS.

Esempio: test Breusch-Pagan in SAS

Supponiamo di voler adattare un modello di regressione lineare multipla che utilizzi il numero di ore trascorse a studiare e il numero di esami pratici sostenuti per prevedere il voto dell’esame finale degli studenti:

Punteggio esame = β 0 + β 1 (ore) + β 2 (esami preparatori)

Innanzitutto, utilizzeremo il seguente codice per creare un set di dati contenente queste informazioni per 20 studenti:

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 90
5 4 90
3 4 82
4 4 85
6 5 90
2 1 83
1 0 62
2 1 76
;
run ;

/*view dataset*/
proc print data =exam_data; 

Successivamente, utilizzeremo il modello proc per adattare questo modello di regressione lineare multipla, nonché l’affermazione pagana per eseguire il test di Breusch-Pagan per l’eteroschedasticità:

 /*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
    parms a1 b1 b2;
    score = a1 + b1*hours + b2*prep_exams;
    fit score / pagan=(1 hours prep_exams)
    out =resid1 outsid ;
run ;
quit ; 

Test di Breusch-Pagan nel SAS

L’ultima tabella dei risultati mostra i risultati del test di Breusch-Pagan.

Da questa tabella possiamo vedere che la statistica del test è 5,05 e il corrispondente valore p è 0,0803 .

Poiché il valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla.

Ciò significa che non abbiamo prove sufficienti per affermare che l’eteroschedasticità è presente nel modello di regressione.

È quindi possibile interpretare con sicurezza gli errori standard delle stime dei coefficienti nella tabella riepilogativa della regressione.

Cosa fare dopo

Se non si rifiuta l’ipotesi nulla del test di Breusch-Pagan, l’eteroschedasticità non è presente e si può procedere a interpretare il risultato della regressione originale.

Tuttavia, se si rifiuta l’ipotesi nulla, significa che nei dati è presente l’eteroschedasticità. In questo caso, gli errori standard visualizzati nella tabella di output della regressione potrebbero essere inaffidabili.

Esistono diversi modi comuni per risolvere questo problema, tra cui:

1. Trasformare la variabile di risposta. Puoi provare a eseguire una trasformazione sulla variabile di risposta.

Ad esempio, puoi utilizzare la variabile di risposta del log invece della variabile di risposta originale.

In generale , prendere il logaritmo della variabile di risposta è un modo efficace per rimuovere l’eteroschedasticità.

Un’altra trasformazione comune consiste nell’utilizzare la radice quadrata della variabile di risposta.

2. Utilizzare la regressione ponderata. Questo tipo di regressione assegna un peso a ciascun punto dati in base alla varianza del relativo valore adattato.

Ciò assegna piccoli pesi ai punti dati che presentano varianze più elevate, riducendo i loro quadrati residui.

Quando vengono utilizzati i pesi appropriati, ciò può eliminare il problema dell’eteroschedasticità.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *