So berechnen sie die quadratsumme in der anova (mit beispiel)


In der Statistik wird eine einfaktorielle ANOVA verwendet, um die Mittelwerte von drei oder mehr unabhängigen Gruppen zu vergleichen, um festzustellen, ob zwischen den Mittelwerten der entsprechenden Population ein statistisch signifikanter Unterschied besteht.

Wenn Sie eine einfaktorielle ANOVA durchführen, berechnen Sie immer drei Quadratsummenwerte:

1. Summe der Quadrate-Regression (SSR)

  • Es ist die Summe der Quadrate der Differenzen zwischen dem Durchschnitt jeder Gruppe und dem allgemeinen Durchschnitt .

2. Quadratsummenfehler (SSE)

  • Dies ist die Summe der Quadrate der Differenzen zwischen jeder einzelnen Beobachtung und dem Gruppenmittelwert dieser Beobachtung.

3. Summe der Gesamtquadrate (SST)

  • Dies ist die Summe der Quadrate der Differenzen zwischen jeder einzelnen Beobachtung und dem Gesamtdurchschnitt.

Jeder dieser drei Werte wird in die endgültige ANOVA-Tabelle aufgenommen, anhand derer wir bestimmen, ob zwischen den Gruppenmitteln ein statistisch signifikanter Unterschied besteht oder nicht.

Das folgende Beispiel zeigt, wie jeder dieser Quadratsummenwerte für eine einfache ANOVA in der Praxis berechnet wird.

Beispiel: So berechnen Sie die Quadratsumme in der ANOVA

Angenommen, wir möchten wissen, ob drei verschiedene Prüfungsvorbereitungsprogramme zu unterschiedlichen Durchschnittsergebnissen bei einer bestimmten Prüfung führen. Um dies zu testen, rekrutieren wir 30 Studierende für die Teilnahme an einer Studie und teilen sie in drei Gruppen auf.

Den Schülern jeder Gruppe wird nach dem Zufallsprinzip zugeteilt, dass sie in den folgenden drei Wochen eines von drei Prüfungsvorbereitungsprogrammen nutzen sollen, um sich auf eine Prüfung vorzubereiten. Am Ende der drei Wochen legen alle Studierenden die gleiche Prüfung ab.

Die Prüfungsergebnisse für jede Gruppe sind unten aufgeführt:

Beispiel für einfaktorielle ANOVA-Daten

Die folgenden Schritte zeigen, wie die Summe der Quadratwerte für diese einfaktorielle ANOVA berechnet wird.

Schritt 1: Berechnen Sie den Gruppendurchschnitt und den Gesamtdurchschnitt.

Zunächst berechnen wir den Durchschnitt der drei Gruppen sowie den Gesamtdurchschnitt (oder „Gesamtdurchschnitt“):

Schritt 2: Berechnen Sie den SSR.

Als nächstes berechnen wir die Summe der Quadrate-Regression (SSR) mit der folgenden Formel:

nΣ(X jX ..) 2

Gold:

  • n : die Stichprobengröße der Gruppe j
  • Σ : ein griechisches Symbol mit der Bedeutung „Summe“
  • X j : der Durchschnitt der Gruppe j
  • X .. : der Gesamtdurchschnitt

In unserem Beispiel berechnen wir, dass SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2

Schritt 3: SES berechnen.

Als nächstes berechnen wir die Summe der Fehlerquadrate (SSE) mit der folgenden Formel:

Σ(X ijX j ) 2

Gold:

  • Σ : ein griechisches Symbol mit der Bedeutung „Summe“
  • X ij : die i-te Beobachtung der Gruppe j
  • X j : der Durchschnitt der Gruppe j

In unserem Beispiel berechnen wir den SSE wie folgt:

Gruppe 1: (85-83,4) 2 + (86-83,4) 2 +   (88-83,4) 2 +   (75-83,4) 2 +   (78-83,4) 2 +   (94-83,4) 2 +   (98-83,4) 2 +   (79-83,4) 2 +   (71-83,4) 2 +   (80-83,4) 2 = 640,4

Gruppe 2: (91-89,3) 2 + (92-89,3) 2 +   (93-89,3) 2 +   (85-89,3) 2 +   (87-89,3) 2 +   (84-89,3) 2 +   (82-89,3) 2 +   (88-89,3) 2 +   (95-89,3) 2 +   (96-89,3) 2 = 208,1

Gruppe 3: (79-84,7) 2 + (78-84,7) 2 +   (88-84,7) 2 +   (94-84,7) 2 +   (92-84,7) 2 +   (85-84,7) 2 +   (83-84,7) 2 +   (85-84,7) 2 +   (82-84,7) 2 +   (81-84,7) 2 = 252,1

ESS: 640,4 + 208,1 + 252,1 = 1.100,6

Schritt 4: Berechnen Sie den SST.

Als nächstes berechnen wir die Gesamtquadratsumme (SST) mit der folgenden Formel:

SST = SSR + SSE

In unserem Beispiel ist SST = 192,2 + 1100,6 = 1292,8

Nachdem wir die Werte von SSR, SSE und SST berechnet haben, wird jeder dieser Werte schließlich in die ANOVA-Tabelle eingefügt:

Quelle Summe der Quadrate (SS) df Mittlere Quadrate (MS) F-Wert p-Wert
Rückschritt 192.2 2 96,1 2.358 0,1138
Fehler 1100.6 27 40.8
Gesamt 1292,8 29

So haben wir die verschiedenen Zahlen in der Tabelle berechnet:

  • Regression df: k-1 = 3-1 = 2
  • Fehler df: nk = 30-3 = 27
  • Gesamt-df: n-1 = 30-1 = 29
  • SEP-Behandlung: SST-Behandlung/df = 192,2 / 2 = 96,1
  • MS-Fehler: SSE-Fehler / df = 1100,6 / 27 = 40,8
  • F-Wert: MS-Verarbeitung / MS-Fehler = 96,1 / 40,8 = 2,358
  • p-Wert : p-Wert, der dem F-Wert entspricht.

Hinweis: n = Gesamtzahl der Beobachtungen, k = Anzahl der Gruppen

Sehen Sie sich dieses Tutorial an, um zu erfahren, wie Sie den F-Wert und den p-Wert in der ANOVA-Tabelle interpretieren.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert