So führen sie einen breusch-pagan-test in sas durch
Um festzustellen, ob in einer Regressionsanalyse Heteroskedastizität vorliegt, wird ein Breusch-Pagan-Test verwendet.
In diesem Tutorial wird erläutert, wie Sie einen Breusch-Pagan-Test in SAS durchführen.
Beispiel: Breusch-Pagan-Test in SAS
Angenommen, wir möchten ein multiples lineares Regressionsmodell anpassen, das die Anzahl der Lernstunden und die Anzahl der abgelegten Übungsprüfungen verwendet, um die Abschlussnote der Schüler vorherzusagen:
Prüfungsergebnis = β 0 + β 1 (Stunden) + β 2 (Vorprüfungen)
Zuerst verwenden wir den folgenden Code, um einen Datensatz mit diesen Informationen für 20 Schüler zu erstellen:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 90 5 4 90 3 4 82 4 4 85 6 5 90 2 1 83 1 0 62 2 1 76 ; run ; /*view dataset*/ proc print data =exam_data;
Als nächstes verwenden wir das Proc-Modell, um dieses multiple lineare Regressionsmodell anzupassen, sowie die Pagan- Anweisung, um den Breusch-Pagan-Test auf Heteroskedastizität durchzuführen:
/*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
parms a1 b1 b2;
score = a1 + b1*hours + b2*prep_exams;
fit score / pagan=(1 hours prep_exams)
out =resid1 outsid ;
run ;
quit ;
Die letzte Ergebnistabelle zeigt die Ergebnisse des Breusch-Pagan-Tests.
Aus dieser Tabelle können wir ersehen, dass die Teststatistik 5,05 beträgt und der entsprechende p-Wert 0,0803 beträgt.
Da der p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen.
Dies bedeutet, dass wir nicht über ausreichende Beweise verfügen, um zu behaupten, dass Heteroskedastizität im Regressionsmodell vorhanden ist.
Daher ist es möglich, die Standardfehler der Koeffizientenschätzungen in der Regressionsübersichtstabelle sicher zu interpretieren.
Was macht man als nächstes
Wenn Sie die Nullhypothese des Breusch-Pagan-Tests nicht ablehnen, liegt keine Heteroskedastizität vor und Sie können mit der Interpretation des Ergebnisses der ursprünglichen Regression fortfahren.
Wenn Sie jedoch die Nullhypothese ablehnen, bedeutet dies, dass in den Daten Heteroskedastizität vorliegt. In diesem Fall sind die in der Regressionsausgabetabelle angezeigten Standardfehler möglicherweise unzuverlässig.
Es gibt mehrere gängige Möglichkeiten, dieses Problem zu lösen, darunter:
1. Transformieren Sie die Antwortvariable. Sie können versuchen, eine Transformation für die Antwortvariable durchzuführen.
Sie können beispielsweise die Protokollantwortvariable anstelle der ursprünglichen Antwortvariablen verwenden.
Im Allgemeinen ist die Protokollierung der Antwortvariablen eine wirksame Möglichkeit, Heteroskedastizität zu beseitigen.
Eine weitere übliche Transformation besteht darin, die Quadratwurzel der Antwortvariablen zu verwenden.
2. Verwenden Sie eine gewichtete Regression. Diese Art der Regression weist jedem Datenpunkt basierend auf der Varianz seines angepassten Werts eine Gewichtung zu.
Dadurch erhalten Datenpunkte mit höheren Varianzen kleine Gewichtungen, wodurch ihre Restquadrate reduziert werden.
Durch die Verwendung geeigneter Gewichte kann das Problem der Heteroskedastizität beseitigt werden.