R'de post-hoc ikili karşılaştırmalar nasıl yapılır?


Üç veya daha fazla bağımsız grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için tek yönlü ANOVA kullanılır.

Tek yönlü bir ANOVA aşağıdaki boş ve alternatif hipotezleri kullanır:

  • H 0 : Tüm grup ortalamaları eşittir.
  • H A : Tüm grup ortalamaları eşit değildir.

ANOVA’nın genel p değeri belirli bir anlamlılık düzeyinin altındaysa (örneğin α = 0,05), o zaman sıfır hipotezini reddederiz ve tüm grup ortalamalarının eşit olmadığı sonucuna varırız.

Hangi grup ortalamalarının farklı olduğunu bulmak için post-hoc ikili karşılaştırmalar yapabiliriz.

Aşağıdaki örnek, R’de aşağıdaki post-hoc ikili karşılaştırmaların nasıl gerçekleştirileceğini gösterir:

  • Tukey yöntemi
  • Scheffe yöntemi
  • Bonferroni yöntemi
  • Holm yöntemi

Örnek: R’de Tek Yönlü ANOVA

Bir öğretmenin üç farklı çalışma tekniğinin öğrenciler arasında farklı test puanlarına yol açıp açmadığını bilmek istediğini varsayalım. Bunu test etmek için rastgele 10 öğrenciyi her çalışma tekniğini kullanmaları için görevlendiriyor ve sınav sonuçlarını kaydediyor.

Üç grup arasındaki ortalama sınav puanları farklılıklarını test etmek amacıyla tek yönlü bir ANOVA gerçekleştirmek için R’de aşağıdaki kodu kullanabiliriz:

 #create data frame
df <- data.frame(technique = rep(c(" tech1 ", " tech2 ", " tech3 "), each= 10 ),
                 score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                           81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                           77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#perform one-way ANOVA
model <- aov(score ~ technique, data = df)

#view output of ANOVA
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technical 2 211.5 105.73 3.415 0.0476 *
Residuals 27 836.0 30.96                 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ANOVA’nın genel p değeri (0,0476) α = 0,05’ten küçüktür, dolayısıyla ortalama sınav puanının her çalışma tekniği için aynı olduğuna ilişkin boş hipotezi reddedeceğiz.

Hangi grupların farklı ortalamalara sahip olduğunu belirlemek için post-hoc ikili karşılaştırmalar yapabiliriz.

Tukey yöntemi

Her grubun örneklem büyüklüğü eşit olduğunda Tukey’in post hoc yöntemini kullanmak en iyisidir.

R’de Tukey post-hoc yöntemini yürütmek için yerleşik TukeyHSD() işlevini kullanabiliriz:

 #perform the Tukey post-hoc method
TukeyHSD(model, conf. level = .95 )

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = score ~ technique, data = df)

$technical
            diff lwr upr p adj
tech2-tech1 4.2 -1.9700112 10.370011 0.2281369
tech3-tech1 6.4 0.2299888 12.570011 0.0409017
tech3-tech2 2.2 -3.9700112 8.370011 0.6547756

Sonuçtan, 0,05’ten küçük tek p değerinin (“ p adj ”) teknik ile teknik 3 arasındaki fark olduğunu görebiliriz.

Dolayısıyla Teknik 1 ve Teknik 3’ü kullanan öğrenciler arasında yalnızca ortalama sınav puanları arasında istatistiksel olarak anlamlı bir fark olduğu sonucuna varabiliriz.

Scheffe yöntemi

Scheffe yöntemi en muhafazakar post-hoc ikili karşılaştırma yöntemidir ve grup ortalamalarını karşılaştırırken en geniş güven aralıklarını üretir.

R’de Scheffe post-hoc yöntemini çalıştırmak için DescTools paketindeki ScheffeTest() fonksiyonunu kullanabiliriz:

 library (DescTools)

#perform the Scheffe post-hoc method
ScheffeTest(model)

  Posthoc multiple comparisons of means: Scheffe Test 
    95% family-wise confidence level

$technical
            diff lwr.ci upr.ci pval    
tech2-tech1 4.2 -2.24527202 10.645272 0.2582    
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .  
tech3-tech2 2.2 -4.24527202 8.645272 0.6803    

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1'''156

Sonuçlardan 0,05’ten düşük p değerlerinin olmadığını görebiliyoruz, dolayısıyla gruplar arasında ortalama sınav puanları arasında istatistiksel olarak anlamlı bir fark olmadığı sonucuna varıyoruz.

Bonferroni yöntemi

Bir dizi planlı ikili karşılaştırma yapmak istediğinizde Bonferroni yöntemini kullanmak en iyisidir.

Bonferroni post hoc yöntemini gerçekleştirmek için R’de aşağıdaki sözdizimini kullanabiliriz:

 #perform the Bonferroni post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' bonferroni ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.309 -    
tech3 0.048 1.000

P value adjustment method: bonferroni

Sonuçtan, 0,05’ten küçük tek p değerinin teknik ile teknik 3 arasındaki fark olduğunu görebiliriz.

Dolayısıyla Teknik 1 ve Teknik 3’ü kullanan öğrenciler arasında yalnızca ortalama sınav puanları arasında istatistiksel olarak anlamlı bir fark olduğu sonucuna varabiliriz.

Holm yöntemi

Holm yöntemi, önceden planlanmış bir dizi ikili karşılaştırma yapmak istediğinizde de kullanılır ve Bonferroni yönteminden daha yüksek güce sahip olma eğiliminde olduğundan sıklıkla tercih edilir.

Holm post-hoc yöntemini çalıştırmak için R’de aşağıdaki sözdizimini kullanabiliriz:

 #perform the Holm post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' holm ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.206 -    
tech3 0.048 0.384

P value adjustment method: holm

Sonuçtan, 0,05’ten küçük tek p değerinin teknik ile teknik 3 arasındaki fark olduğunu görebiliriz.

Dolayısıyla yine Teknik 1 ve Teknik 3’ü kullanan öğrenciler arasında ortalama sınav puanları arasında yalnızca istatistiksel olarak anlamlı bir fark olduğu sonucuna varabiliriz.

Ek kaynaklar

Aşağıdaki eğitimler ANOVA ve post-hoc testler hakkında ek bilgi sağlar:

ANOVA’da F değeri ve P değeri nasıl yorumlanır?
Tam Kılavuz: ANOVA Sonuçları Nasıl Raporlanır?
Tukey vs. Bonferroni vs. Scheffe: Hangi Testi Kullanmalısınız?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir