So erstellen sie partielle residuendiagramme in r

Von Dr. Benjamin Anderson Juli 21, 2023 Führung Keine Kommentare

Die multiple lineare Regression ist eine statistische Methode, mit der wir die Beziehung zwischen mehreren Prädiktorvariablen und einer Antwortvariablen verstehen können.

Eine der wichtigsten Annahmen der multiplen linearen Regression ist jedoch, dass zwischen jeder Prädiktorvariablen und der Antwortvariablen eine lineare Beziehung besteht.

Wenn diese Annahme nicht erfüllt ist, sind die Ergebnisse des Regressionsmodells möglicherweise nicht zuverlässig.

Eine Möglichkeit, diese Annahme zu testen, besteht darin, ein Diagramm mit partiellen Residuen zu erstellen, das die Residuen einer Prädiktorvariablen relativ zur Antwortvariablen anzeigt.

Das folgende Beispiel zeigt, wie man partielle Residuendiagramme für ein Regressionsmodell in R erstellt.

Beispiel: So erstellen Sie partielle Residuendiagramme in R

Angenommen, wir passen ein Regressionsmodell mit drei Prädiktorvariablen in R an:

 #make this example reproducible
set. seeds (0)

#define response variable
y <- c(1:1000)

#define three predictor variables
x1 <- c(1:1000)*runif(n=1000)
x2 <- (c(1:1000)*rnorm(n=1000))^2
x3 <- (c(1:1000)*rnorm(n=1000))^3

#fit multiple linear regression model
model <- lm(y~x1+x2+x3))

Wir können die Funktion crPlots() aus dem Paket car in R verwenden, um partielle Residuendiagramme für jede Prädiktorvariable im Modell zu erstellen:

 library (car)

#create partial residual plots
crPlots(model)

Teilrestdiagramme in R

Die blaue Linie zeigt die erwarteten Residuen, wenn die Beziehung zwischen dem Prädiktor und der Antwortvariablen linear wäre. Die rosa Linie zeigt die tatsächlichen Residuen.

Wenn sich die beiden Linien deutlich unterscheiden, deutet dies auf einen nichtlinearen Zusammenhang hin.

Aus den obigen Grafiken können wir ersehen, dass die Residuen für x2 und x3 nichtlinear erscheinen.

Dies verstößt gegen die Linearitätsannahme der multiplen linearen Regression. Eine Möglichkeit, dieses Problem zu lösen, besteht darin, eine Quadrat- oder Kubikwurzeltransformation für die Prädiktorvariablen zu verwenden:

 library (car)

#fit new model with transformed predictor variables
model_transformed <- lm(y~x1+sqrt(x2)+log10(x3^(1/3)))

#create partial residual plots for new model
crPlots(model_transformed)

Aus den partiellen Residuendiagrammen können wir erkennen, dass x2 jetzt eine linearere Beziehung zur Antwortvariablen hat.

Die x3-Prädiktorvariable ist immer noch etwas nichtlinear, daher entscheiden wir uns möglicherweise für eine andere Transformation oder entfernen die Variable möglicherweise ganz aus dem Modell.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie man andere gängige Diagramme in R erstellt:

So erstellen Sie Diagnosediagramme in R
So erstellen Sie ein Maßstabs- und Standortdiagramm in R
So erstellen Sie ein Residuendiagramm in R

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen

Beispiel: So erstellen Sie partielle Residuendiagramme in R

Zusätzliche Ressourcen

Über den Autor

Dr. Benjamin Anderson

Einen Kommentar hinzufügen