So berechnen sie standardisierte residuen in excel
Ein Residuum ist die Differenz zwischen einem beobachteten Wert und einem vorhergesagten Wert in einemRegressionsmodell .
Es wird wie folgt berechnet:
Residuum = Beobachteter Wert – Vorhergesagter Wert
Wenn wir die beobachteten Werte grafisch darstellen und die angepasste Regressionslinie überlagern, wären die Residuen für jede Beobachtung der vertikale Abstand zwischen der Beobachtung und der Regressionslinie:
Eine Art von Residuen, die wir häufig verwenden, um Ausreißer in einem Regressionsmodell zu identifizieren, wird als standardisiertes Residuum bezeichnet.
Es wird wie folgt berechnet:
r i = e i / s(e i ) = e i / RSE√ 1-h ii
Gold:
- e i : Der i- te Rest
- RSE: der verbleibende Standardfehler des Modells
- h ii : Der Aufstieg der i-ten Beobachtung
In der Praxis betrachten wir häufig jedes standardisierte Residuum, dessen absoluter Wert größer als 3 ist, als Ausreißer.
Dieses Tutorial bietet ein schrittweises Beispiel für die Berechnung standardisierter Residuen in Excel.
Schritt 1: Geben Sie die Daten ein
Zuerst geben wir Werte aus einem kleinen Datensatz in Excel ein:
Schritt 2: Residuen berechnen
Als Nächstes navigieren wir zur Registerkarte „Daten“ im oberen Menüband und klicken in der Gruppe „Analyse“ auf „Datenanalyse“ :
Wenn Sie dieses Add-in noch nicht installiert haben, sehen Sie sich dieses Tutorial an, um zu erfahren, wie es geht. Es ist einfach zu installieren und völlig kostenlos.
Sobald Sie auf „Datenanalyse“ klicken, klicken Sie auf die Option „ Regression “ und dann auf „OK“ . Geben Sie im neuen Fenster, das erscheint, die folgenden Informationen ein und klicken Sie auf OK :
Das Residuum für jede Beobachtung erscheint im Ergebnis:
Kopieren Sie diese Residuen und fügen Sie sie in eine neue Spalte neben den Originaldaten ein:
Schritt 3: Berechnen Sie den Hebel
Als nächstes müssen wir die Hebelwirkung jeder Beobachtung berechnen.
Das folgende Bild zeigt, wie das geht:
Hier sind die Formeln, die in den verschiedenen Zellen verwendet werden:
- B14: =COUNT(B2:B13)
- B15: = DURCHSCHNITT (B2: B13)
- B16: =DEVSQ(B2:B13)
- E2: =1/$B$14+(B2-$B$15)^2/$B$16
Schritt 4: Berechnen Sie standardisierte Residuen
Schließlich können wir die standardisierten Residuen mithilfe der Formel berechnen:
r i = e i / RSE√ 1-h ii
Der CSR des Modells kann den Ergebnissen des Vorgängermodells entnommen werden. Es ergibt sich ein Wert von 4,44 :
Daher können wir die folgende Formel verwenden, um das standardisierte Residuum für jede Beobachtung zu berechnen:
Anhand der Ergebnisse können wir erkennen, dass keines der standardisierten Residuen einen absoluten Wert von 3 überschreitet. Somit scheint keine der Beobachtungen Ausreißer zu sein.
Es ist zu beachten, dass Forscher in manchen Fällen Beobachtungen, deren standardisierte Residuen einen absoluten Wert von 2 überschreiten, als Ausreißer betrachten.
Es liegt an Ihnen, ob Sie einen absoluten Wert von 2 oder 3 als Schwellenwert für Ausreißer verwenden, abhängig von dem spezifischen Problem, an dem Sie arbeiten.
Zusätzliche Ressourcen
Was sind Rückstände?
Was sind standardisierte Residuen?
Einführung in die multiple lineare Regression