Kompletny przewodnik: jak interpretować wyniki anova w r


Jednoczynnikową ANOVA stosuje się do określenia, czy istnieje statystycznie istotna różnica między średnimi z trzech lub więcej niezależnych grup.

Ten samouczek zawiera kompletny przewodnik dotyczący interpretacji wyników jednokierunkowej analizy ANOVA w języku R.

Krok 1: Utwórz dane

Załóżmy, że chcemy ustalić, czy trzy różne programy treningowe powodują różną średnią utratę wagi u poszczególnych osób.

Aby to przetestować, rekrutujemy 90 osób do udziału w eksperymencie, w którym losowo przydzielamy 30 osób do uczestniczenia w Programie A, Programie B lub Programie C przez miesiąc.

Poniższy kod tworzy ramkę danych, z którą będziemy pracować:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

Krok 2: Wykonaj ANOVA

Następnie użyjemy polecenia aov() , aby wykonać jednokierunkową ANOVA:

 #fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)

Krok 3: Interpretacja wyników ANOVA

Następnie użyjemy polecenia podsumowanie() do wyświetlenia jednokierunkowych wyników ANOVA:

 #view summary of one-way ANOVA model
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Oto jak interpretować każdą wartość wyniku:

Program Df: Stopnie swobody programu zmiennego. Oblicza się to jako #grupy -1. W tym przypadku były 3 różne programy szkoleniowe, więc ta wartość wynosi: 3-1 = 2 .

Df Reszty: Stopnie swobody reszt. Oblicza się to jako #obserwacje ogółem – #grupy. W tym przypadku było 90 obserwacji i 3 grupy, zatem wartość ta wynosi: 90 -3 = 87 .

Suma programu Sq: Suma kwadratów skojarzona z programem zmiennym. Wartość ta wynosi 98,93 .

Suma kwadratów reszt: suma kwadratów związanych z resztami lub „błędami”. Wartość ta wynosi 139,57 .

Średni kwadrat. Program: Średnia suma kwadratów skojarzona z programem. Oblicza się to jako sumę kwadratową. program / program Df. W tym przypadku oblicza się to następująco: 98,93 / 2 = 49,46 .

Średni kwadrat. Reszty: średnia suma kwadratów związanych z resztami. Oblicza się to jako sumę kwadratową. pozostałości / pozostałości Df. W tym przypadku oblicza się to w następujący sposób: 139,57 / 87 = 1,60 .

Wartość F: Ogólna statystyka F modelu ANOVA. Oblicza się to jako średni kwadrat. program / Średni kwadrat. Pozostałości. W tym przypadku oblicza się to w następujący sposób: 49,46 / 1,60 = 30,83 .

Pr(>F): Wartość p powiązana ze statystyką F z licznikiem df = 2 i mianownikiem df = 87. W tym przypadku wartość p wynosi 7,552e-11 , co jest niezwykle małą liczbą.

Najważniejszą wartością w zestawie wyników jest wartość p, ponieważ mówi nam, czy istnieje istotna różnica w wartościach średnich pomiędzy trzema grupami.

Przypomnijmy, że jednokierunkowa analiza ANOVA wykorzystuje następujące hipotezy zerowe i alternatywne:

  • H 0 (hipoteza zerowa): wszystkie średnie grupowe są równe.
  • H A (hipoteza alternatywna): Przynajmniej jedna średnia grupowa różni się od pozostałych.

Ponieważ wartość p w naszej tabeli ANOVA (0,7552e-11) jest mniejsza niż 0,05, mamy wystarczające dowody, aby odrzucić hipotezę zerową.

Oznacza to, że mamy wystarczające dowody, aby stwierdzić, że średnia utrata masy ciała doświadczana przez poszczególne osoby nie jest równa w przypadku trzech programów treningowych.

Krok 4: Wykonaj test post-hoc (jeśli to konieczne)

Jeśli wartość p w wyniku ANOVA jest mniejsza niż 0,05, odrzucamy hipotezę zerową. To mówi nam, że średnia wartość pomiędzy każdą grupą nie jest równa. Nie mówi nam to jednak , które grupy różnią się od siebie.

Aby się tego dowiedzieć, musimy przeprowadzić test post hoc . W R możemy w tym celu użyć funkcji TukeyHSD() :

 #perform Tukey post-hoc test
TukeyHSD(model)

$program
         diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199

Oto jak interpretować wyniki:

  • Skorygowana wartość p dla średniej różnicy między grupami A i B wynosi 0,0100545 .
  • Skorygowana wartość p dla średniej różnicy między grupami A i C wynosi 0,0000000 .
  • Skorygowana wartość p dla średniej różnicy pomiędzy grupami B i C wynosi 0,0000199 .

Ponieważ każda z skorygowanych wartości p jest mniejsza niż 0,05, możemy stwierdzić, że istnieje znacząca różnica w średniej utracie masy ciała pomiędzy każdą grupą.

Dodatkowe zasoby

Wprowadzenie do jednokierunkowej ANOVA
Jak sprawdzić założenia ANOVA
Jak ręcznie wykonać jednokierunkową ANOVA
Jednokierunkowy kalkulator ANOVA

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *