Guida completa: come interpretare i risultati anova in r


Un’ANOVA unidirezionale viene utilizzata per determinare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi indipendenti.

Questo tutorial fornisce una guida completa su come interpretare i risultati di un’ANOVA unidirezionale in R.

Passaggio 1: creare i dati

Supponiamo di voler determinare se tre diversi programmi di allenamento determinano una diversa perdita di peso media negli individui.

Per testarlo, reclutiamo 90 persone per partecipare a un esperimento in cui assegniamo casualmente 30 persone a seguire il Programma A, il Programma B o il Programma C per un mese.

Il codice seguente crea il frame di dati con cui lavoreremo:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

Passaggio 2: eseguire l’ANOVA

Successivamente, utilizzeremo il comando aov() per eseguire un’ANOVA unidirezionale:

 #fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)

Passaggio 3: interpretare i risultati ANOVA

Successivamente, utilizzeremo il comando summary() per visualizzare i risultati ANOVA unidirezionali:

 #view summary of one-way ANOVA model
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ecco come interpretare ciascun valore del risultato:

Programma Df: I gradi di libertà della variabile programma . Questo viene calcolato come #gruppi -1. In questo caso c’erano 3 diversi programmi di allenamento, quindi questo valore è: 3-1 = 2 .

Df Residui: I gradi di libertà dei residui. Questo viene calcolato come #osservazioni totali – #gruppi. In questo caso c’erano 90 osservazioni e 3 gruppi, quindi questo valore è: 90 -3 = 87 .

Program Sum Sq: la somma dei quadrati associati alla variabile program . Questo valore è 98,93 .

Somma dei quadrati dei residui: somma dei quadrati associati ai residui o “errori”. Questo valore è 139,57 .

Quadrato medio. Programma: la somma media dei quadrati associati al programma. Questo viene calcolato come somma quadrata. programma / programma Df. In questo caso, questo viene calcolato come: 98,93 / 2 = 49,46 .

Quadrato medio. Residui: somma media dei quadrati associati ai residui. Questo viene calcolato come somma quadrata. residui / residui Df. In questo caso, questo viene calcolato come segue: 139,57 / 87 = 1,60 .

Valore F: la statistica F complessiva del modello ANOVA. Questo viene calcolato come il quadrato medio. programma/media quadrata. Residui. In questo caso si calcola come segue: 49,46 / 1,60 = 30,83 .

Pr(>F): il valore p associato alla statistica F con numeratore df = 2 e denominatore df = 87. In questo caso, il valore p è 7.552e-11 , che è un numero estremamente piccolo.

Il valore più importante nell’insieme dei risultati è il valore p, perché ci dice se c’è una differenza significativa nei valori medi tra i tre gruppi.

Ricordiamo che un’ANOVA unidirezionale utilizza le seguenti ipotesi nulle e alternative:

  • H 0 (ipotesi nulla): tutte le medie dei gruppi sono uguali.
  • H A (ipotesi alternativa): almeno una media del gruppo è diversa dalle altre.

Poiché il valore p nella nostra tabella ANOVA (.7552e-11) è inferiore a 0,05, abbiamo prove sufficienti per rifiutare l’ipotesi nulla.

Ciò significa che abbiamo prove sufficienti per affermare che la perdita di peso media sperimentata dagli individui non è uguale tra i tre programmi di allenamento.

Passaggio 4: eseguire test post-hoc (se necessario)

Se il valore p nell’output ANOVA è inferiore a 0,05, rifiutiamo l’ipotesi nulla. Questo ci dice che il valore medio tra ciascun gruppo non è uguale. Tuttavia, questo non ci dice quali gruppi differiscono l’uno dall’altro.

Per scoprirlo dobbiamo effettuare un test post hoc . In R, possiamo usare la funzione TukeyHSD() per fare questo:

 #perform Tukey post-hoc test
TukeyHSD(model)

$program
         diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199

Ecco come interpretare i risultati:

  • Il valore p aggiustato per la differenza media tra i gruppi A e B è 0,0100545 .
  • Il valore p aggiustato per la differenza media tra i gruppi A e C è 0,0000000 .
  • Il valore p aggiustato per la differenza media tra i gruppi B e C è 0,0000199 .

Poiché ciascuno dei valori p corretti è inferiore a 0,05, possiamo concludere che esiste una differenza significativa nella perdita di peso media tra ciascun gruppo.

Risorse addizionali

Introduzione all’ANOVA unidirezionale
Come verificare le ipotesi ANOVA
Come eseguire manualmente un’ANOVA unidirezionale
Calcolatore ANOVA unidirezionale

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *