So erstellen sie ein residuendiagramm in r


Residuendiagramme werden häufig verwendet, um zu beurteilen, ob die Residuen einer Regressionsanalyse normalverteilt sind und ob sie Heteroskedastizität aufweisen oder nicht.

In diesem Tutorial wird erklärt, wie man Residuendiagramme für ein Regressionsmodell in R erstellt.

Beispiel: Residuendiagramme in R

In diesem Beispiel passen wir ein Regressionsmodell mithilfe des in mtcars integrierten R-Datensatzes an und erstellen dann drei verschiedene Residuendiagramme, um die Residuen zu analysieren.

Schritt 1: Passen Sie das Regressionsmodell an.

Zuerst passen wir ein Regressionsmodell an, das mpg als Antwortvariable und disp und hp als erklärende Variablen verwendet:

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

Schritt 2: Erstellen Sie ein Rest- oder angepasstes Diagramm.

Als Nächstes erstellen wir ein Residuen-/angepasstes Diagramm, das zur visuellen Erkennung von Heteroskedastizität nützlich ist – beispielsweise einer systematischen Änderung in der Verteilung von Residuen über einen Wertebereich.

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

Verbleibendes oder angepasstes Gelände in R

Die x-Achse zeigt die angepassten Werte und die y-Achse zeigt die Residuen an. Aus der Grafik können wir ersehen, dass die Verteilung der Residuen bei höheren angepassten Werten tendenziell höher ist. Dies scheint jedoch nicht schwerwiegend genug zu sein, als dass wir Änderungen am Modell vornehmen müssten.

Schritt 3: Erstellen Sie ein QQ-Diagramm.

Wir können auch ein QQ-Diagramm erstellen, mit dem sich ermitteln lässt, ob die Residuen einer Normalverteilung folgen. Wenn die Datenwerte im Diagramm einer annähernd geraden Linie im 45-Grad-Winkel folgen, sind die Daten normalverteilt.

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

Rest-Q-Q-Diagramm in R

Wir können sehen, dass die Residuen dazu neigen, ein wenig von der Linie in der Nähe der Enden abzuweichen, was darauf hindeuten könnte, dass sie nicht normalverteilt sind.

Schritt 4: Erstellen Sie ein Dichtediagramm.

Wir können auch ein Dichtediagramm erstellen, das auch für die visuelle Überprüfung nützlich ist, ob die Residuen normalverteilt sind oder nicht. Wenn das Diagramm ungefähr glockenförmig ist, folgen die Residuen wahrscheinlich einer Normalverteilung.

 #Create density plot of residuals
plot(density(res))

Restdichtekurve in R

Wir können sehen, dass das Dichtediagramm ungefähr einer Glockenform folgt, obwohl es leicht nach rechts geneigt ist. Abhängig von der Art der Studie kann sich ein Forscher dazu entschließen, eine Transformation der Daten durchzuführen, um sicherzustellen, dass die Residuen normaler verteilt sind.

Zusätzliche Ressourcen

So berechnen Sie standardisierte Residuen in R
So berechnen Sie studentisierte Residuen in R
So erstellen Sie ein Histogramm von Residuen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert