Was ist ein residuen-/leverage-diagramm? (definition & #038; beispiel)
Eine Darstellung der Residuen im Vergleich zur Hebelwirkung ist eine Art Diagnosediagramm , mit dem wir einflussreiche Beobachtungen in einem Regressionsmodell identifizieren können.
So sieht diese Art von Diagramm in der statistischen Programmiersprache R aus:
Jede Beobachtung im Datensatz wird als einzelner Punkt im Diagramm angezeigt. Die x-Achse zeigt die Hebelwirkung jedes Punkts und die y-Achse zeigt das standardisierte Residuum jedes Punkts.
Der Hebel bezieht sich auf das Ausmaß, in dem sich die Koeffizienten des Regressionsmodells ändern würden, wenn eine bestimmte Beobachtung aus dem Datensatz entfernt würde.
Beobachtungen mit hohem Leverage haben einen starken Einfluss auf die Koeffizienten des Regressionsmodells. Wenn wir diese Beobachtungen entfernen, würden sich die Modellkoeffizienten erheblich ändern.
Standardisierte Residuen beziehen sich auf die standardisierte Differenz zwischen einem vorhergesagten Wert für eine Beobachtung und dem tatsächlichen Wert der Beobachtung.
Es ist zu beachten, dass eine Beobachtung einen hohen absoluten Wert für ein standardisiertes Residuum, aber einen niedrigen Wert für die Hebelwirkung haben kann.
So interpretieren Sie ein Residuen-Hebel-Diagramm
Wenn ein Punkt in diesem Diagramm außerhalb der Cook-Distanz liegt (die rot gepunkteten Linien), gilt dies als einflussreiche Beobachtung.
Schauen wir uns das zuvor gezeigte Diagramm „Residuen vs. Hebelwirkung“ an:
Im obigen Beispiel können wir sehen, dass Beobachtung Nr. 10 der Cook-Distanzgrenze am nächsten kommt, aber nicht über die gepunktete Linie hinausgeht. Das bedeutet , dass es in unserem Regressionsmodell keine Einflusspunkte gibt .
Nehmen wir jedoch an, dass wir das folgende Residuen-/Hebelwirkungsdiagramm haben:
Wir können sehen, dass Beobachtung Nr. 1 in der oberen rechten Ecke außerhalb der rot gepunkteten Linien liegt. Dies weist darauf hin, dass es sich um einen Einflusspunkt handelt .
Das heißt, wenn wir diese Beobachtung aus unserem Datensatz entfernen und das Regressionsmodell erneut anpassen würden, würden sich die Modellkoeffizienten erheblich ändern.
Wie man mit einflussreichen Beobachtungen umgeht
Wenn Sie ein Diagramm der Residuen im Vergleich zur Hebelwirkung für ein Modell erstellen und feststellen, dass eine oder mehrere Beobachtungen als einflussreich identifiziert werden, können Sie mehrere Dinge tun:
1. Stellen Sie sicher, dass die Beobachtung kein Fehler ist.
Bevor Sie Maßnahmen ergreifen, sollten Sie zunächst sicherstellen, dass einflussreiche Beobachtungen nicht auf einen Dateneingabefehler oder ein anderes seltsames Ereignis zurückzuführen sind.
2. Versuchen Sie, ein anderes Regressionsmodell anzupassen.
Einflussreiche Beobachtungen können darauf hinweisen, dass das von Ihnen angegebene Modell nicht gut zu den Daten passt. In diesem Fall können Sie ein polynomiales Regressionsmodell oder ein nichtlineares Modell ausprobieren.
3. Entfernen Sie einflussreiche Kommentare.
Schließlich können Sie beschließen, einflussreiche Beobachtungen einfach zu entfernen, wenn das von Ihnen angegebene Modell bis auf ein oder zwei einflussreiche Beobachtungen gut zu den Daten zu passen scheint.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zur Verwendung von Residuen zur Bewertung der Passung von Regressionsmodellen.
Was sind Residuen in der Statistik?
Was sind standardisierte Residuen?
So interpretieren Sie Diagnosediagramme in R