Come eseguire confronti a coppie post-hoc in r


Un’ANOVA unidirezionale viene utilizzata per determinare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi indipendenti.

Un’ANOVA unidirezionale utilizza le seguenti ipotesi nulle e alternative:

  • H 0 : tutte le medie dei gruppi sono uguali.
  • H A : Non tutte le medie dei gruppi sono uguali.

Se il valore p complessivo dell’ANOVA è inferiore a un certo livello di significatività (ad esempio α = 0,05), allora rifiutiamo l’ipotesi nulla e concludiamo che tutte le medie dei gruppi non sono uguali.

Per scoprire quali medie di gruppo sono diverse, possiamo quindi eseguire confronti a coppie post-hoc .

L’esempio seguente mostra come eseguire i seguenti confronti a coppie post-hoc in R:

  • Il metodo Tukey
  • Il metodo Scheffe
  • Il metodo Bonferroni
  • Il metodo Holm

Esempio: ANOVA unidirezionale in R

Supponiamo che un insegnante voglia sapere se tre diverse tecniche di studio portano o meno a punteggi diversi nei test tra gli studenti. Per verificarlo, assegna in modo casuale 10 studenti a utilizzare ciascuna tecnica di studio e registra i risultati degli esami.

Possiamo utilizzare il seguente codice in R per eseguire un’ANOVA unidirezionale per verificare le differenze nei punteggi medi degli esami tra i tre gruppi:

 #create data frame
df <- data.frame(technique = rep(c(" tech1 ", " tech2 ", " tech3 "), each= 10 ),
                 score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                           81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                           77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#perform one-way ANOVA
model <- aov(score ~ technique, data = df)

#view output of ANOVA
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technical 2 211.5 105.73 3.415 0.0476 *
Residuals 27 836.0 30.96                 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Il valore p complessivo dell’ANOVA (0,0476) è inferiore a α = 0,05, quindi rifiuteremo l’ipotesi nulla secondo cui il punteggio medio dell’esame è lo stesso per ciascuna tecnica di studio.

Possiamo eseguire confronti a coppie post-hoc per determinare quali gruppi hanno medie diverse.

Il metodo Tukey

È preferibile utilizzare il metodo post hoc di Tukey quando la dimensione del campione di ciascun gruppo è uguale.

Possiamo utilizzare la funzione integrata TukeyHSD() per eseguire il metodo post-hoc Tukey in R:

 #perform the Tukey post-hoc method
TukeyHSD(model, conf. level = .95 )

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = score ~ technique, data = df)

$technical
            diff lwr upr p adj
tech2-tech1 4.2 -1.9700112 10.370011 0.2281369
tech3-tech1 6.4 0.2299888 12.570011 0.0409017
tech3-tech2 2.2 -3.9700112 8.370011 0.6547756

Dal risultato, possiamo vedere che l’unico valore p (“ p adj ”) inferiore a 0,05 è la differenza tra tecnica e tecnica 3.

Pertanto, potremmo concludere che esiste solo una differenza statisticamente significativa nei punteggi medi degli esami tra gli studenti che hanno utilizzato la Tecnica 1 e la Tecnica 3.

Il metodo Scheffe

Il metodo Scheffe è il metodo di confronto a coppie post-hoc più conservativo e produce gli intervalli di confidenza più ampi quando si confrontano le medie dei gruppi.

Possiamo usare la funzione ScheffeTest() dal pacchetto DescTools per eseguire il metodo post-hoc Scheffe in R:

 library (DescTools)

#perform the Scheffe post-hoc method
ScheffeTest(model)

  Posthoc multiple comparisons of means: Scheffe Test 
    95% family-wise confidence level

$technical
            diff lwr.ci upr.ci pval    
tech2-tech1 4.2 -2.24527202 10.645272 0.2582    
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .  
tech3-tech2 2.2 -4.24527202 8.645272 0.6803    

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1'''156

Dai risultati possiamo vedere che non esistono valori p inferiori a 0,05, quindi concluderemmo che non esiste alcuna differenza statisticamente significativa nei punteggi medi degli esami tra i gruppi.

Il metodo Bonferroni

È preferibile utilizzare il metodo Bonferroni quando si desidera eseguire una serie di confronti a coppie pianificati.

Possiamo utilizzare la seguente sintassi in R per eseguire il metodo post hoc Bonferroni:

 #perform the Bonferroni post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' bonferroni ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.309 -    
tech3 0.048 1.000

P value adjustment method: bonferroni

Dal risultato, possiamo vedere che l’unico valore p inferiore a 0,05 è la differenza tra tecnica e tecnica 3.

Pertanto, potremmo concludere che esiste solo una differenza statisticamente significativa nei punteggi medi degli esami tra gli studenti che hanno utilizzato la Tecnica 1 e la Tecnica 3.

Il metodo Holm

Il metodo Holm viene utilizzato anche quando si desidera eseguire in anticipo una serie di confronti a coppie pianificati e tende ad avere una potenza ancora maggiore rispetto al metodo Bonferroni, quindi è spesso preferito.

Possiamo usare la seguente sintassi in R per eseguire il metodo Holm post-hoc:

 #perform the Holm post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' holm ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.206 -    
tech3 0.048 0.384

P value adjustment method: holm

Dal risultato possiamo vedere che l’unico valore p inferiore a 0,05 è la differenza tra tecnica e tecnica 3.

Quindi, ancora una volta, concluderemmo che esiste solo una differenza statisticamente significativa nei punteggi medi degli esami tra gli studenti che hanno utilizzato la Tecnica 1 e la Tecnica 3.

Risorse addizionali

Le esercitazioni seguenti forniscono informazioni aggiuntive sull’ANOVA e sui test post-hoc:

Come interpretare il valore F e il valore P in ANOVA
La guida completa: come riportare i risultati ANOVA
Turchia vs. Bonferroni vs. Scheffe: quale test dovresti usare?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *