Jak obliczyć sumę kwadratów w anova (z przykładem)


W statystyce jednoczynnikową analizę ANOVA stosuje się do porównania średnich trzech lub większej liczby niezależnych grup w celu ustalenia, czy istnieje statystycznie istotna różnica między średnimi odpowiedniej populacji.

Za każdym razem, gdy przeprowadzasz jednokierunkową analizę ANOVA, zawsze obliczysz trzy sumy wartości kwadratów:

1. Regresja sumy kwadratów (SSR)

  • Jest to suma kwadratów różnic pomiędzy średnią każdej grupy a średnią ogólną .

2. Błąd sumy kwadratów (SSE)

  • Jest to suma kwadratów różnic między każdą indywidualną obserwacją a średnią grupową tej obserwacji.

3. Suma wszystkich kwadratów (SST)

  • Jest to suma kwadratów różnic między każdą indywidualną obserwacją a średnią ogólną.

Każda z tych trzech wartości jest umieszczana w końcowej tabeli ANOVA, której używamy do określenia, czy istnieje statystycznie istotna różnica między średnimi grupowymi.

Poniższy przykład pokazuje, jak w praktyce obliczyć każdą z tych sum wartości kwadratów dla jednokierunkowej ANOVA.

Przykład: Jak obliczyć sumę kwadratów w ANOVA

Załóżmy, że chcemy wiedzieć, czy trzy różne programy przygotowujące do testów prowadzą do różnych średnich wyników na danym egzaminie. Aby to przetestować, rekrutujemy 30 studentów do udziału w badaniu i dzielimy ich na trzy grupy.

Uczniowie w każdej grupie są losowo przydzielani do korzystania z jednego z trzech programów przygotowujących do testów przez kolejne trzy tygodnie w celu przygotowania się do egzaminu. Po trzech tygodniach wszyscy uczniowie przystępują do tego samego egzaminu.

Poniżej wyniki egzaminów dla poszczególnych grup:

Przykład jednokierunkowych danych ANOVA

Poniższe kroki pokazują, jak obliczyć sumę wartości kwadratów dla tej jednokierunkowej ANOVA.

Krok 1: Oblicz średnią grupową i średnią ogólną.

Najpierw obliczymy średnią z trzech grup, a także średnią ogólną (lub „ogólną”):

Krok 2: Oblicz SSR.

Następnie obliczymy sumę kwadratów regresji (SSR) korzystając z następującego wzoru:

nΣ(X jX ..) 2

Złoto:

  • n : liczebność próby grupy j
  • Σ : grecki symbol oznaczający „sumę”
  • X j : średnia grupy j
  • X .. : średnia ogólna

W naszym przykładzie obliczamy, że SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2

Krok 3: Oblicz SES.

Następnie obliczymy sumę błędów kwadratów (SSE), korzystając z następującego wzoru:

Σ(X ijX j ) 2

Złoto:

  • Σ : grecki symbol oznaczający „sumę”
  • X ij : i-ta obserwacja grupy j
  • X j : średnia grupy j

W naszym przykładzie obliczamy SSE w następujący sposób:

Grupa 1: (85-83,4) 2 + (86-83,4) 2 +   (88-83,4) 2 +   (75-83,4) 2 +   (78-83,4) 2 +   (94-83,4) 2 +   (98-83,4) 2 +   (79-83,4) 2 +   (71-83,4) 2 +   (80-83,4) 2 = 640,4

Grupa 2: (91-89,3) 2 + (92-89,3) 2 +   (93-89,3) 2 +   (85-89,3) 2 +   (87-89,3) 2 +   (84-89,3) 2 +   (82-89,3) 2 +   (88-89,3) 2 +   (95-89,3) 2 +   (96-89,3) 2 = 208,1

Grupa 3: (79-84,7) 2 + (78-84,7) 2 +   (88-84,7) 2 +   (94-84,7) 2 +   (92-84,7) 2 +   (85-84,7) 2 +   (83-84,7) 2 +   (85-84,7) 2 +   (82-84,7) 2 +   (81-84,7) 2 = 252,1

ESS: 640,4 + 208,1 + 252,1 = 1100,6

Krok 4: Oblicz SST.

Następnie obliczymy całkowitą sumę kwadratów (SST) za pomocą następującego wzoru:

SST = SSR + SSE

W naszym przykładzie SST = 192,2 + 1100,6 = 1292,8

Kiedy już obliczymy wartości SSR, SSE i SST, każda z tych wartości zostanie ostatecznie umieszczona w tabeli ANOVA:

Źródło Suma kwadratów (SS) zm Średnie kwadraty (MS) Wartość F wartość p
Regresja 192.2 2 96.1 2358 0,1138
Błąd 1100,6 27 40,8
Całkowity 1292,8 29

Oto jak obliczyliśmy różne liczby w tabeli:

  • regresja df: k-1 = 3-1 = 2
  • błąd df: nk = 30-3 = 27
  • całkowity df: n-1 = 30-1 = 29
  • Obróbka SEP: Obróbka SST/df = 192,2 / 2 = 96,1
  • Błąd MS: błąd SSE / df = 1100,6 / 27 = 40,8
  • Wartość F: przetwarzanie MS / błąd MS = 96,1 / 40,8 = 2,358
  • wartość p : wartość p odpowiadająca wartości F.

Uwaga: n = całkowita liczba obserwacji, k = liczba grup

Sprawdź ten samouczek, aby dowiedzieć się, jak interpretować wartości F i wartość p w tabeli ANOVA.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *