Jak obliczyć sumę kwadratów w anova (z przykładem)
W statystyce jednoczynnikową analizę ANOVA stosuje się do porównania średnich trzech lub większej liczby niezależnych grup w celu ustalenia, czy istnieje statystycznie istotna różnica między średnimi odpowiedniej populacji.
Za każdym razem, gdy przeprowadzasz jednokierunkową analizę ANOVA, zawsze obliczysz trzy sumy wartości kwadratów:
1. Regresja sumy kwadratów (SSR)
- Jest to suma kwadratów różnic pomiędzy średnią każdej grupy a średnią ogólną .
2. Błąd sumy kwadratów (SSE)
- Jest to suma kwadratów różnic między każdą indywidualną obserwacją a średnią grupową tej obserwacji.
3. Suma wszystkich kwadratów (SST)
- Jest to suma kwadratów różnic między każdą indywidualną obserwacją a średnią ogólną.
Każda z tych trzech wartości jest umieszczana w końcowej tabeli ANOVA, której używamy do określenia, czy istnieje statystycznie istotna różnica między średnimi grupowymi.
Poniższy przykład pokazuje, jak w praktyce obliczyć każdą z tych sum wartości kwadratów dla jednokierunkowej ANOVA.
Przykład: Jak obliczyć sumę kwadratów w ANOVA
Załóżmy, że chcemy wiedzieć, czy trzy różne programy przygotowujące do testów prowadzą do różnych średnich wyników na danym egzaminie. Aby to przetestować, rekrutujemy 30 studentów do udziału w badaniu i dzielimy ich na trzy grupy.
Uczniowie w każdej grupie są losowo przydzielani do korzystania z jednego z trzech programów przygotowujących do testów przez kolejne trzy tygodnie w celu przygotowania się do egzaminu. Po trzech tygodniach wszyscy uczniowie przystępują do tego samego egzaminu.
Poniżej wyniki egzaminów dla poszczególnych grup:
Poniższe kroki pokazują, jak obliczyć sumę wartości kwadratów dla tej jednokierunkowej ANOVA.
Krok 1: Oblicz średnią grupową i średnią ogólną.
Najpierw obliczymy średnią z trzech grup, a także średnią ogólną (lub „ogólną”):
Krok 2: Oblicz SSR.
Następnie obliczymy sumę kwadratów regresji (SSR) korzystając z następującego wzoru:
nΣ(X j – X ..) 2
Złoto:
- n : liczebność próby grupy j
- Σ : grecki symbol oznaczający „sumę”
- X j : średnia grupy j
- X .. : średnia ogólna
W naszym przykładzie obliczamy, że SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2
Krok 3: Oblicz SES.
Następnie obliczymy sumę błędów kwadratów (SSE), korzystając z następującego wzoru:
Σ(X ij – X j ) 2
Złoto:
- Σ : grecki symbol oznaczający „sumę”
- X ij : i-ta obserwacja grupy j
- X j : średnia grupy j
W naszym przykładzie obliczamy SSE w następujący sposób:
Grupa 1: (85-83,4) 2 + (86-83,4) 2 + (88-83,4) 2 + (75-83,4) 2 + (78-83,4) 2 + (94-83,4) 2 + (98-83,4) 2 + (79-83,4) 2 + (71-83,4) 2 + (80-83,4) 2 = 640,4
Grupa 2: (91-89,3) 2 + (92-89,3) 2 + (93-89,3) 2 + (85-89,3) 2 + (87-89,3) 2 + (84-89,3) 2 + (82-89,3) 2 + (88-89,3) 2 + (95-89,3) 2 + (96-89,3) 2 = 208,1
Grupa 3: (79-84,7) 2 + (78-84,7) 2 + (88-84,7) 2 + (94-84,7) 2 + (92-84,7) 2 + (85-84,7) 2 + (83-84,7) 2 + (85-84,7) 2 + (82-84,7) 2 + (81-84,7) 2 = 252,1
ESS: 640,4 + 208,1 + 252,1 = 1100,6
Krok 4: Oblicz SST.
Następnie obliczymy całkowitą sumę kwadratów (SST) za pomocą następującego wzoru:
SST = SSR + SSE
W naszym przykładzie SST = 192,2 + 1100,6 = 1292,8
Kiedy już obliczymy wartości SSR, SSE i SST, każda z tych wartości zostanie ostatecznie umieszczona w tabeli ANOVA:
Źródło | Suma kwadratów (SS) | zm | Średnie kwadraty (MS) | Wartość F | wartość p |
---|---|---|---|---|---|
Regresja | 192.2 | 2 | 96.1 | 2358 | 0,1138 |
Błąd | 1100,6 | 27 | 40,8 | ||
Całkowity | 1292,8 | 29 |
Oto jak obliczyliśmy różne liczby w tabeli:
- regresja df: k-1 = 3-1 = 2
- błąd df: nk = 30-3 = 27
- całkowity df: n-1 = 30-1 = 29
- Obróbka SEP: Obróbka SST/df = 192,2 / 2 = 96,1
- Błąd MS: błąd SSE / df = 1100,6 / 27 = 40,8
- Wartość F: przetwarzanie MS / błąd MS = 96,1 / 40,8 = 2,358
- wartość p : wartość p odpowiadająca wartości F.
Uwaga: n = całkowita liczba obserwacji, k = liczba grup
Sprawdź ten samouczek, aby dowiedzieć się, jak interpretować wartości F i wartość p w tabeli ANOVA.