Hoe de som van de kwadraten in anova te berekenen (met voorbeeld)


In de statistiek wordt een eenrichtings-ANOVA gebruikt om de gemiddelden van drie of meer onafhankelijke groepen te vergelijken om te bepalen of er een statistisch significant verschil is tussen de gemiddelden van de overeenkomstige populatie.

Wanneer u een one-way ANOVA uitvoert, berekent u altijd drie som van kwadratenwaarden:

1. Som van kwadratenregressie (SSR)

  • Het is de som van de kwadraten van de verschillen tussen het gemiddelde van elke groep en het algemeen gemiddelde .

2. Som van kwadratenfout (SSE)

  • Dit is de som van de kwadraten van de verschillen tussen elke individuele waarneming en het groepsgemiddelde van die waarneming.

3. Som van totale kwadraten (SST)

  • Dit is de som van de kwadraten van de verschillen tussen elke individuele waarneming en het algemene gemiddelde.

Elk van deze drie waarden wordt in de uiteindelijke ANOVA-tabel geplaatst, die we gebruiken om te bepalen of er al dan niet een statistisch significant verschil is tussen de groepsgemiddelden.

Het volgende voorbeeld laat zien hoe u elk van deze kwadratensomwaarden voor een eenrichtings-ANOVA in de praktijk kunt berekenen.

Voorbeeld: hoe u de som van de kwadraten in ANOVA berekent

Stel dat we willen weten of drie verschillende toetsvoorbereidingsprogramma’s al dan niet tot verschillende gemiddelde scores op een bepaald examen leiden. Om dit te testen werven we 30 studenten om mee te doen aan een onderzoek en verdelen ze in drie groepen.

Studenten in elke groep worden willekeurig toegewezen om de komende drie weken een van de drie toetsvoorbereidingsprogramma’s te gebruiken ter voorbereiding op een examen. Aan het einde van de drie weken leggen alle studenten hetzelfde examen af.

Hieronder vindt u de examenresultaten per groep:

Voorbeeld van eenrichtings-ANOVA-gegevens

De volgende stappen laten zien hoe u de som van de kwadratenwaarden voor deze eenrichtings-ANOVA berekent.

Stap 1: Bereken het groepsgemiddelde en het algehele gemiddelde.

Eerst berekenen we het gemiddelde van de drie groepen, evenals het algemene (of “algemene”) gemiddelde:

Stap 2: Bereken de SSR.

Vervolgens berekenen we de som van de kwadratenregressie (SSR) met behulp van de volgende formule:

nΣ( XjX ..) 2

Goud:

  • n : de steekproefomvang van groep j
  • Σ : een Grieks symbool dat “som” betekent
  • Xj : het gemiddelde van groep j
  • X .. : het algemene gemiddelde

In ons voorbeeld berekenen we dat SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2

Stap 3: Bereken SES.

Vervolgens berekenen we de som van de kwadratenfout (SSE) met behulp van de volgende formule:

Σ ( XijXj ) 2

Goud:

  • Σ : een Grieks symbool dat “som” betekent
  • X ij : de ide waarneming van groep j
  • Xj : het gemiddelde van groep j

In ons voorbeeld berekenen we de SSE als volgt:

Groep 1: (85-83,4) 2 + (86-83,4) 2 +   (88-83,4) 2+   (75-83,4) 2+   (78-83,4) 2+   (94-83,4) 2+   (98-83,4) 2+   (79-83,4) 2+   (71-83,4) 2+   (80-83,4) 2 = 640,4

Groep 2: (91-89.3) 2 + (92-89.3) 2 +   (93-89,3) 2+   (85-89,3) 2+   (87-89,3) 2+   (84-89,3) 2+   (82-89,3) 2+   (88-89,3) 2+   (95-89,3) 2+   (96-89,3) 2 = 208,1

Groep 3: (79-84,7) 2 + (78-84,7) 2 +   (88-84,7) 2+   (94-84,7) 2+   (92-84,7) 2+   (85-84,7) 2+   (83-84,7) 2+   (85-84,7) 2+   (82-84,7) 2+   (81-84,7) 2 = 252,1

ESS: 640,4 + 208,1 + 252,1 = 1.100,6

Stap 4: Bereken de SST.

Vervolgens berekenen we de totale som van kwadraten (SST) met behulp van de volgende formule:

SST = SSR + SSE

In ons voorbeeld is SST = 192,2 + 1100,6 = 1292,8

Nadat we de waarden van SSR, SSE en SST hebben berekend, wordt elk van deze waarden uiteindelijk in de ANOVA-tabel geplaatst:

Bron Som van kwadraten (SS) df Gemiddelde kwadraten (MS) F-waarde p-waarde
Regressie 192,2 2 96,1 2.358 0,1138
Fout 1100,6 27 40,8
Totaal 1292,8 29

Zo hebben we de verschillende getallen in de tabel berekend:

  • regressie df: k-1 = 3-1 = 2
  • fout df: nk = 30-3 = 27
  • totale df: n-1 = 30-1 = 29
  • SEP-behandeling: SST-behandeling/df = 192,2 / 2 = 96,1
  • MS-fout: SSE-fout / df = 1100,6 / 27 = 40,8
  • F-waarde: MS-verwerking / MS-fout = 96,1 / 40,8 = 2,358
  • p-waarde : p-waarde die overeenkomt met de F-waarde.

Opmerking: n = totaal aantal waarnemingen, k = aantal groepen

Bekijk deze tutorial om te leren hoe u de F-waarde en p-waarde in de ANOVA-tabel interpreteert.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert