So berechnen sie die quadratsumme in der anova (mit beispiel)
In der Statistik wird eine einfaktorielle ANOVA verwendet, um die Mittelwerte von drei oder mehr unabhängigen Gruppen zu vergleichen, um festzustellen, ob zwischen den Mittelwerten der entsprechenden Population ein statistisch signifikanter Unterschied besteht.
Wenn Sie eine einfaktorielle ANOVA durchführen, berechnen Sie immer drei Quadratsummenwerte:
1. Summe der Quadrate-Regression (SSR)
- Es ist die Summe der Quadrate der Differenzen zwischen dem Durchschnitt jeder Gruppe und dem allgemeinen Durchschnitt .
2. Quadratsummenfehler (SSE)
- Dies ist die Summe der Quadrate der Differenzen zwischen jeder einzelnen Beobachtung und dem Gruppenmittelwert dieser Beobachtung.
3. Summe der Gesamtquadrate (SST)
- Dies ist die Summe der Quadrate der Differenzen zwischen jeder einzelnen Beobachtung und dem Gesamtdurchschnitt.
Jeder dieser drei Werte wird in die endgültige ANOVA-Tabelle aufgenommen, anhand derer wir bestimmen, ob zwischen den Gruppenmitteln ein statistisch signifikanter Unterschied besteht oder nicht.
Das folgende Beispiel zeigt, wie jeder dieser Quadratsummenwerte für eine einfache ANOVA in der Praxis berechnet wird.
Beispiel: So berechnen Sie die Quadratsumme in der ANOVA
Angenommen, wir möchten wissen, ob drei verschiedene Prüfungsvorbereitungsprogramme zu unterschiedlichen Durchschnittsergebnissen bei einer bestimmten Prüfung führen. Um dies zu testen, rekrutieren wir 30 Studierende für die Teilnahme an einer Studie und teilen sie in drei Gruppen auf.
Den Schülern jeder Gruppe wird nach dem Zufallsprinzip zugeteilt, dass sie in den folgenden drei Wochen eines von drei Prüfungsvorbereitungsprogrammen nutzen sollen, um sich auf eine Prüfung vorzubereiten. Am Ende der drei Wochen legen alle Studierenden die gleiche Prüfung ab.
Die Prüfungsergebnisse für jede Gruppe sind unten aufgeführt:
Die folgenden Schritte zeigen, wie die Summe der Quadratwerte für diese einfaktorielle ANOVA berechnet wird.
Schritt 1: Berechnen Sie den Gruppendurchschnitt und den Gesamtdurchschnitt.
Zunächst berechnen wir den Durchschnitt der drei Gruppen sowie den Gesamtdurchschnitt (oder „Gesamtdurchschnitt“):
Schritt 2: Berechnen Sie den SSR.
Als nächstes berechnen wir die Summe der Quadrate-Regression (SSR) mit der folgenden Formel:
nΣ(X j – X ..) 2
Gold:
- n : die Stichprobengröße der Gruppe j
- Σ : ein griechisches Symbol mit der Bedeutung „Summe“
- X j : der Durchschnitt der Gruppe j
- X .. : der Gesamtdurchschnitt
In unserem Beispiel berechnen wir, dass SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2
Schritt 3: SES berechnen.
Als nächstes berechnen wir die Summe der Fehlerquadrate (SSE) mit der folgenden Formel:
Σ(X ij – X j ) 2
Gold:
- Σ : ein griechisches Symbol mit der Bedeutung „Summe“
- X ij : die i-te Beobachtung der Gruppe j
- X j : der Durchschnitt der Gruppe j
In unserem Beispiel berechnen wir den SSE wie folgt:
Gruppe 1: (85-83,4) 2 + (86-83,4) 2 + (88-83,4) 2 + (75-83,4) 2 + (78-83,4) 2 + (94-83,4) 2 + (98-83,4) 2 + (79-83,4) 2 + (71-83,4) 2 + (80-83,4) 2 = 640,4
Gruppe 2: (91-89,3) 2 + (92-89,3) 2 + (93-89,3) 2 + (85-89,3) 2 + (87-89,3) 2 + (84-89,3) 2 + (82-89,3) 2 + (88-89,3) 2 + (95-89,3) 2 + (96-89,3) 2 = 208,1
Gruppe 3: (79-84,7) 2 + (78-84,7) 2 + (88-84,7) 2 + (94-84,7) 2 + (92-84,7) 2 + (85-84,7) 2 + (83-84,7) 2 + (85-84,7) 2 + (82-84,7) 2 + (81-84,7) 2 = 252,1
ESS: 640,4 + 208,1 + 252,1 = 1.100,6
Schritt 4: Berechnen Sie den SST.
Als nächstes berechnen wir die Gesamtquadratsumme (SST) mit der folgenden Formel:
SST = SSR + SSE
In unserem Beispiel ist SST = 192,2 + 1100,6 = 1292,8
Nachdem wir die Werte von SSR, SSE und SST berechnet haben, wird jeder dieser Werte schließlich in die ANOVA-Tabelle eingefügt:
Quelle | Summe der Quadrate (SS) | df | Mittlere Quadrate (MS) | F-Wert | p-Wert |
---|---|---|---|---|---|
Rückschritt | 192.2 | 2 | 96,1 | 2.358 | 0,1138 |
Fehler | 1100.6 | 27 | 40.8 | ||
Gesamt | 1292,8 | 29 |
So haben wir die verschiedenen Zahlen in der Tabelle berechnet:
- Regression df: k-1 = 3-1 = 2
- Fehler df: nk = 30-3 = 27
- Gesamt-df: n-1 = 30-1 = 29
- SEP-Behandlung: SST-Behandlung/df = 192,2 / 2 = 96,1
- MS-Fehler: SSE-Fehler / df = 1100,6 / 27 = 40,8
- F-Wert: MS-Verarbeitung / MS-Fehler = 96,1 / 40,8 = 2,358
- p-Wert : p-Wert, der dem F-Wert entspricht.
Hinweis: n = Gesamtzahl der Beobachtungen, k = Anzahl der Gruppen
Sehen Sie sich dieses Tutorial an, um zu erfahren, wie Sie den F-Wert und den p-Wert in der ANOVA-Tabelle interpretieren.