So führen sie einen breusch-pagan-test in r durch


Um festzustellen , ob in einer Regressionsanalyse Heteroskedastizität vorliegt, wird ein Breusch-Pagan-Test verwendet.

In diesem Tutorial wird erklärt, wie man einen Breusch-Pagan-Test in R durchführt.

Beispiel: Breusch-Pagan-Test in R

In diesem Beispiel passen wir ein Regressionsmodell mithilfe des in mtcars integrierten R-Datensatzes an und führen dann einen Breusch-Pagan-Test mithilfe der bptest- Funktion aus der lmtest- Bibliothek durch, um festzustellen, ob Heteroskedastizität vorliegt.

Schritt 1: Passen Sie ein Regressionsmodell an.

Zunächst passen wir ein Regressionsmodell an, das mpg als Antwortvariable und disp und hp als zwei erklärende Variablen verwendet.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Schritt 2: Führen Sie einen Breusch-Pagan-Test durch.

Als nächstes führen wir einen Breusch-Pagan-Test durch, um festzustellen, ob Heteroskedastizität vorliegt.

 #load lmtest library
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 4.0861, df = 2, p-value = 0.1296

Die Teststatistik beträgt 4,0861 und der entsprechende p-Wert beträgt 0,1296 . Da der p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Wir haben keine ausreichenden Beweise, um zu behaupten, dass Heteroskedastizität im Regressionsmodell vorhanden ist.

Was macht man als nächstes

Wenn Sie die Nullhypothese des Breusch-Pagan-Tests nicht ablehnen, liegt keine Heteroskedastizität vor und Sie können mit der Interpretation des Ergebnisses der ursprünglichen Regression fortfahren.

Wenn Sie jedoch die Nullhypothese ablehnen, bedeutet dies, dass in den Daten Heteroskedastizität vorliegt. In diesem Fall sind die in der Regressionsausgabetabelle angezeigten Standardfehler möglicherweise unzuverlässig.

Es gibt mehrere gängige Möglichkeiten, dieses Problem zu lösen, darunter:

1. Transformieren Sie die Antwortvariable. Sie können versuchen, eine Transformation für die Antwortvariable durchzuführen. Sie können beispielsweise die Protokollantwortvariable anstelle der ursprünglichen Antwortvariablen verwenden. Im Allgemeinen ist die Protokollierung der Antwortvariablen eine wirksame Möglichkeit, Heteroskedastizität zu beseitigen. Eine weitere übliche Transformation besteht darin, die Quadratwurzel der Antwortvariablen zu verwenden.

2. Verwenden Sie eine gewichtete Regression. Diese Art der Regression weist jedem Datenpunkt basierend auf der Varianz seines angepassten Werts eine Gewichtung zu. Im Wesentlichen werden dadurch Datenpunkte mit höheren Varianzen niedrig gewichtet, wodurch ihre Restquadrate reduziert werden. Durch die Verwendung geeigneter Gewichte kann das Problem der Heteroskedastizität beseitigt werden.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert