So berechnen sie standardisierte residuen in excel


Ein Residuum ist die Differenz zwischen einem beobachteten Wert und einem vorhergesagten Wert in einemRegressionsmodell .

Es wird wie folgt berechnet:

Residuum = Beobachteter Wert – Vorhergesagter Wert

Wenn wir die beobachteten Werte grafisch darstellen und die angepasste Regressionslinie überlagern, wären die Residuen für jede Beobachtung der vertikale Abstand zwischen der Beobachtung und der Regressionslinie:

Beispiel für ein Residuum in der Statistik

Eine Art von Residuen, die wir häufig verwenden, um Ausreißer in einem Regressionsmodell zu identifizieren, wird als standardisiertes Residuum bezeichnet.

Es wird wie folgt berechnet:

r i = e i / s(e i ) = e i / RSE√ 1-h ii

Gold:

  • e i : Der i- te Rest
  • RSE: der verbleibende Standardfehler des Modells
  • h ii : Der Aufstieg der i-ten Beobachtung

In der Praxis betrachten wir häufig jedes standardisierte Residuum, dessen absoluter Wert größer als 3 ist, als Ausreißer.

Dieses Tutorial bietet ein schrittweises Beispiel für die Berechnung standardisierter Residuen in Excel.

Schritt 1: Geben Sie die Daten ein

Zuerst geben wir Werte aus einem kleinen Datensatz in Excel ein:

Schritt 2: Residuen berechnen

Als Nächstes navigieren wir zur Registerkarte „Daten“ im oberen Menüband und klicken in der Gruppe „Analyse“ auf „Datenanalyse“ :

Wenn Sie dieses Add-in noch nicht installiert haben, sehen Sie sich dieses Tutorial an, um zu erfahren, wie es geht. Es ist einfach zu installieren und völlig kostenlos.

Sobald Sie auf „Datenanalyse“ klicken, klicken Sie auf die Option „ Regression “ und dann auf „OK“ . Geben Sie im neuen Fenster, das erscheint, die folgenden Informationen ein und klicken Sie auf OK :

Das Residuum für jede Beobachtung erscheint im Ergebnis:

Residuen in Excel

Kopieren Sie diese Residuen und fügen Sie sie in eine neue Spalte neben den Originaldaten ein:

Schritt 3: Berechnen Sie den Hebel

Als nächstes müssen wir die Hebelwirkung jeder Beobachtung berechnen.

Das folgende Bild zeigt, wie das geht:

Nutzung der Berechnungen in Excel für Statistiken

Hier sind die Formeln, die in den verschiedenen Zellen verwendet werden:

  • B14: =COUNT(B2:B13)
  • B15: = DURCHSCHNITT (B2: B13)
  • B16: =DEVSQ(B2:B13)
  • E2: =1/$B$14+(B2-$B$15)^2/$B$16

Schritt 4: Berechnen Sie standardisierte Residuen

Schließlich können wir die standardisierten Residuen mithilfe der Formel berechnen:

r i = e i / RSE√ 1-h ii

Der CSR des Modells kann den Ergebnissen des Vorgängermodells entnommen werden. Es ergibt sich ein Wert von 4,44 :

Daher können wir die folgende Formel verwenden, um das standardisierte Residuum für jede Beobachtung zu berechnen:

Standardisierte Residuen in Excel

Anhand der Ergebnisse können wir erkennen, dass keines der standardisierten Residuen einen absoluten Wert von 3 überschreitet. Somit scheint keine der Beobachtungen Ausreißer zu sein.

Es ist zu beachten, dass Forscher in manchen Fällen Beobachtungen, deren standardisierte Residuen einen absoluten Wert von 2 überschreiten, als Ausreißer betrachten.

Es liegt an Ihnen, ob Sie einen absoluten Wert von 2 oder 3 als Schwellenwert für Ausreißer verwenden, abhängig von dem spezifischen Problem, an dem Sie arbeiten.

Zusätzliche Ressourcen

Was sind Rückstände?
Was sind standardisierte Residuen?
Einführung in die multiple lineare Regression

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert