Hoe de som van de kwadraten in anova te berekenen (met voorbeeld)
In de statistiek wordt een eenrichtings-ANOVA gebruikt om de gemiddelden van drie of meer onafhankelijke groepen te vergelijken om te bepalen of er een statistisch significant verschil is tussen de gemiddelden van de overeenkomstige populatie.
Wanneer u een one-way ANOVA uitvoert, berekent u altijd drie som van kwadratenwaarden:
1. Som van kwadratenregressie (SSR)
- Het is de som van de kwadraten van de verschillen tussen het gemiddelde van elke groep en het algemeen gemiddelde .
2. Som van kwadratenfout (SSE)
- Dit is de som van de kwadraten van de verschillen tussen elke individuele waarneming en het groepsgemiddelde van die waarneming.
3. Som van totale kwadraten (SST)
- Dit is de som van de kwadraten van de verschillen tussen elke individuele waarneming en het algemene gemiddelde.
Elk van deze drie waarden wordt in de uiteindelijke ANOVA-tabel geplaatst, die we gebruiken om te bepalen of er al dan niet een statistisch significant verschil is tussen de groepsgemiddelden.
Het volgende voorbeeld laat zien hoe u elk van deze kwadratensomwaarden voor een eenrichtings-ANOVA in de praktijk kunt berekenen.
Voorbeeld: hoe u de som van de kwadraten in ANOVA berekent
Stel dat we willen weten of drie verschillende toetsvoorbereidingsprogramma’s al dan niet tot verschillende gemiddelde scores op een bepaald examen leiden. Om dit te testen werven we 30 studenten om mee te doen aan een onderzoek en verdelen ze in drie groepen.
Studenten in elke groep worden willekeurig toegewezen om de komende drie weken een van de drie toetsvoorbereidingsprogramma’s te gebruiken ter voorbereiding op een examen. Aan het einde van de drie weken leggen alle studenten hetzelfde examen af.
Hieronder vindt u de examenresultaten per groep:
De volgende stappen laten zien hoe u de som van de kwadratenwaarden voor deze eenrichtings-ANOVA berekent.
Stap 1: Bereken het groepsgemiddelde en het algehele gemiddelde.
Eerst berekenen we het gemiddelde van de drie groepen, evenals het algemene (of “algemene”) gemiddelde:
Stap 2: Bereken de SSR.
Vervolgens berekenen we de som van de kwadratenregressie (SSR) met behulp van de volgende formule:
nΣ( Xj – X ..) 2
Goud:
- n : de steekproefomvang van groep j
- Σ : een Grieks symbool dat “som” betekent
- Xj : het gemiddelde van groep j
- X .. : het algemene gemiddelde
In ons voorbeeld berekenen we dat SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2
Stap 3: Bereken SES.
Vervolgens berekenen we de som van de kwadratenfout (SSE) met behulp van de volgende formule:
Σ ( Xij – Xj ) 2
Goud:
- Σ : een Grieks symbool dat “som” betekent
- X ij : de ide waarneming van groep j
- Xj : het gemiddelde van groep j
In ons voorbeeld berekenen we de SSE als volgt:
Groep 1: (85-83,4) 2 + (86-83,4) 2 + (88-83,4) 2+ (75-83,4) 2+ (78-83,4) 2+ (94-83,4) 2+ (98-83,4) 2+ (79-83,4) 2+ (71-83,4) 2+ (80-83,4) 2 = 640,4
Groep 2: (91-89.3) 2 + (92-89.3) 2 + (93-89,3) 2+ (85-89,3) 2+ (87-89,3) 2+ (84-89,3) 2+ (82-89,3) 2+ (88-89,3) 2+ (95-89,3) 2+ (96-89,3) 2 = 208,1
Groep 3: (79-84,7) 2 + (78-84,7) 2 + (88-84,7) 2+ (94-84,7) 2+ (92-84,7) 2+ (85-84,7) 2+ (83-84,7) 2+ (85-84,7) 2+ (82-84,7) 2+ (81-84,7) 2 = 252,1
ESS: 640,4 + 208,1 + 252,1 = 1.100,6
Stap 4: Bereken de SST.
Vervolgens berekenen we de totale som van kwadraten (SST) met behulp van de volgende formule:
SST = SSR + SSE
In ons voorbeeld is SST = 192,2 + 1100,6 = 1292,8
Nadat we de waarden van SSR, SSE en SST hebben berekend, wordt elk van deze waarden uiteindelijk in de ANOVA-tabel geplaatst:
Bron | Som van kwadraten (SS) | df | Gemiddelde kwadraten (MS) | F-waarde | p-waarde |
---|---|---|---|---|---|
Regressie | 192,2 | 2 | 96,1 | 2.358 | 0,1138 |
Fout | 1100,6 | 27 | 40,8 | ||
Totaal | 1292,8 | 29 |
Zo hebben we de verschillende getallen in de tabel berekend:
- regressie df: k-1 = 3-1 = 2
- fout df: nk = 30-3 = 27
- totale df: n-1 = 30-1 = 29
- SEP-behandeling: SST-behandeling/df = 192,2 / 2 = 96,1
- MS-fout: SSE-fout / df = 1100,6 / 27 = 40,8
- F-waarde: MS-verwerking / MS-fout = 96,1 / 40,8 = 2,358
- p-waarde : p-waarde die overeenkomt met de F-waarde.
Opmerking: n = totaal aantal waarnemingen, k = aantal groepen
Bekijk deze tutorial om te leren hoe u de F-waarde en p-waarde in de ANOVA-tabel interpreteert.