So führen sie einen breusch-pagan-test in r durch
Um festzustellen , ob in einer Regressionsanalyse Heteroskedastizität vorliegt, wird ein Breusch-Pagan-Test verwendet.
In diesem Tutorial wird erklärt, wie man einen Breusch-Pagan-Test in R durchführt.
Beispiel: Breusch-Pagan-Test in R
In diesem Beispiel passen wir ein Regressionsmodell mithilfe des in mtcars integrierten R-Datensatzes an und führen dann einen Breusch-Pagan-Test mithilfe der bptest- Funktion aus der lmtest- Bibliothek durch, um festzustellen, ob Heteroskedastizität vorliegt.
Schritt 1: Passen Sie ein Regressionsmodell an.
Zunächst passen wir ein Regressionsmodell an, das mpg als Antwortvariable und disp und hp als zwei erklärende Variablen verwendet.
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Schritt 2: Führen Sie einen Breusch-Pagan-Test durch.
Als nächstes führen wir einen Breusch-Pagan-Test durch, um festzustellen, ob Heteroskedastizität vorliegt.
#load lmtest library library(lmtest) #perform Breusch-Pagan Test bptest(model) studentized Breusch-Pagan test data: model BP = 4.0861, df = 2, p-value = 0.1296
Die Teststatistik beträgt 4,0861 und der entsprechende p-Wert beträgt 0,1296 . Da der p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Wir haben keine ausreichenden Beweise, um zu behaupten, dass Heteroskedastizität im Regressionsmodell vorhanden ist.
Was macht man als nächstes
Wenn Sie die Nullhypothese des Breusch-Pagan-Tests nicht ablehnen, liegt keine Heteroskedastizität vor und Sie können mit der Interpretation des Ergebnisses der ursprünglichen Regression fortfahren.
Wenn Sie jedoch die Nullhypothese ablehnen, bedeutet dies, dass in den Daten Heteroskedastizität vorliegt. In diesem Fall sind die in der Regressionsausgabetabelle angezeigten Standardfehler möglicherweise unzuverlässig.
Es gibt mehrere gängige Möglichkeiten, dieses Problem zu lösen, darunter:
1. Transformieren Sie die Antwortvariable. Sie können versuchen, eine Transformation für die Antwortvariable durchzuführen. Sie können beispielsweise die Protokollantwortvariable anstelle der ursprünglichen Antwortvariablen verwenden. Im Allgemeinen ist die Protokollierung der Antwortvariablen eine wirksame Möglichkeit, Heteroskedastizität zu beseitigen. Eine weitere übliche Transformation besteht darin, die Quadratwurzel der Antwortvariablen zu verwenden.
2. Verwenden Sie eine gewichtete Regression. Diese Art der Regression weist jedem Datenpunkt basierend auf der Varianz seines angepassten Werts eine Gewichtung zu. Im Wesentlichen werden dadurch Datenpunkte mit höheren Varianzen niedrig gewichtet, wodurch ihre Restquadrate reduziert werden. Durch die Verwendung geeigneter Gewichte kann das Problem der Heteroskedastizität beseitigt werden.