So berechnen sie sst, ssr und sse in excel


Wir verwenden oft drei verschiedene Quadratsummenwerte , um zu messen, wie gut eine Regressionslinie tatsächlich zu einem Datensatz passt:

1. Summe der Gesamtquadrate (SST) – Die Summe der Quadrate der Differenzen zwischen einzelnen Datenpunkten (y i ) und dem Mittelwert der Antwortvariablen ( y ).

  • SST = Σ(y iy ) 2

2. Summe der Quadrate-Regression (SSR) – Die Summe der Quadrate der Differenzen zwischen den vorhergesagten Datenpunkten (ŷ i ) und dem Mittelwert der Antwortvariablen ( y ).

  • SSR = Σ(ŷ iy ) 2

3. Fehlerquadratsumme (SSE) – Die Summe der Quadrate der Differenzen zwischen den vorhergesagten Datenpunkten (ŷ i ) und den beobachteten Datenpunkten (y i ).

  • SSE = Σ(ŷ i – y i ) 2

Das folgende Schritt-für-Schritt-Beispiel zeigt, wie jede dieser Metriken für ein bestimmtes Regressionsmodell in Excel berechnet wird.

Schritt 1: Erstellen Sie die Daten

Erstellen wir zunächst einen Datensatz mit der Anzahl der Lernstunden und den erzielten Prüfungsergebnissen für 20 verschiedene Schüler an einer bestimmten Schule:

Schritt 2: Passen Sie ein Regressionsmodell an

Klicken Sie im oberen Menüband von Excel auf die Registerkarte „Daten“ und dann auf „Datenanalyse“ . Wenn diese Option nicht angezeigt wird, müssen Sie zunächst die kostenlose Analysis ToolPak-Software installieren .

Datenanalyseoption in Excel

Sobald Sie auf Datenanalyse klicken, erscheint ein neues Fenster. Wählen Sie Regression und klicken Sie auf OK.

Geben Sie im neuen Fenster, das erscheint, die folgenden Informationen ein:

Sobald Sie auf OK klicken, wird die Regressionsausgabe angezeigt.

Schritt 3: Analysieren Sie das Ergebnis

Die drei Quadratsummenmetriken – SST, SSR und SSE – sind in der SS- Spalte der ANOVA- Tabelle zu sehen:

SST, SSR und SSE in Excel

Die Kennzahlen lauten wie folgt:

  • Gesamtsumme der Quadrate (SST): 1248,55
  • Summe der Quadrate-Regression (SSR): 917,4751
  • Fehlerquadratsumme (SSE): 331,0749

Wir können überprüfen, dass SST = SSR + SSE:

  • SST = SSR + SSE
  • 1248,55 = 917,4751 + 331,0749

Wir können das R-Quadrat des Regressionsmodells auch manuell berechnen:

  • R im Quadrat = SSR / SST
  • R im Quadrat = 917,4751 / 1248,55
  • R im Quadrat = 0,7348

Dies zeigt uns, dass 73,48 % der Abweichungen bei den Prüfungsergebnissen durch die Anzahl der gelernten Stunden erklärt werden können.

Zusätzliche Ressourcen

So führen Sie eine einfache lineare Regression in Excel durch
So führen Sie eine multiple lineare Regression in Excel durch
So führen Sie eine Polynomregression in Excel durch
So führen Sie eine exponentielle Regression in Excel durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert