วิธีดำเนินการเปรียบเทียบแบบคู่หลังเฉพาะกิจใน r


การวิเคราะห์ความแปรปรวนแบบทางเดียว ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่

การวิเคราะห์ความแปรปรวนทางเดียวใช้สมมติฐานว่างและทางเลือกต่อไปนี้:

  • H 0 : ค่าเฉลี่ยกลุ่มทั้งหมดเท่ากัน
  • HA : ค่าเฉลี่ยของกลุ่มไม่เท่ากันทั้งหมด

หาก ค่า p-value โดยรวมของ ANOVA ต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น α = 0.05) เราจะปฏิเสธสมมติฐานว่างและสรุปว่าค่าเฉลี่ยกลุ่มทั้งหมดไม่เท่ากัน

เพื่อที่จะค้นหาว่าค่าเฉลี่ยของกลุ่มใดที่แตกต่างกัน เราจึงทำการ เปรียบเทียบแบบคู่หลัง ได้

ตัวอย่างต่อไปนี้แสดงวิธีการดำเนินการเปรียบเทียบแบบคู่หลังใน R:

  • วิธีทูกี้
  • วิธีเชฟเฟ่
  • วิธีบอนเฟอโรนี
  • วิธีโฮล์ม

ตัวอย่าง: การวิเคราะห์ความแปรปรวนแบบทางเดียวใน R

สมมติว่าครูต้องการทราบว่าเทคนิคการเรียนสามแบบที่แตกต่างกันนำไปสู่คะแนนสอบที่แตกต่างกันของนักเรียนหรือไม่ เพื่อทดสอบสิ่งนี้ เธอ สุ่มมอบหมายให้ นักเรียน 10 คนใช้เทคนิคการเรียนแต่ละเทคนิคและบันทึกผลการสอบ

เราสามารถใช้โค้ดต่อไปนี้ใน R เพื่อทำการวิเคราะห์ความแปรปรวนแบบทางเดียวเพื่อทดสอบความแตกต่างของคะแนนสอบเฉลี่ยระหว่างทั้งสามกลุ่ม:

 #create data frame
df <- data.frame(technique = rep(c(" tech1 ", " tech2 ", " tech3 "), each= 10 ),
                 score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                           81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                           77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#perform one-way ANOVA
model <- aov(score ~ technique, data = df)

#view output of ANOVA
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technical 2 211.5 105.73 3.415 0.0476 *
Residuals 27 836.0 30.96                 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ค่า p-value โดยรวมของ ANOVA (0.0476) น้อยกว่า α = 0.05 ดังนั้นเราจะปฏิเสธสมมติฐานว่างที่ว่าคะแนนสอบเฉลี่ยจะเท่ากันสำหรับเทคนิคการศึกษาแต่ละเทคนิค

เราสามารถทำการเปรียบเทียบแบบคู่ภายหลังได้เพื่อพิจารณาว่ากลุ่มใดมีวิธีการที่แตกต่างกัน

วิธีทูกี้

วิธีที่ดีที่สุดคือใช้วิธี post hoc ของ Tukey เมื่อขนาดตัวอย่างของแต่ละกลุ่มเท่ากัน

เราสามารถใช้ฟังก์ชัน TukeyHSD() ในตัวเพื่อดำเนินการเมธอด Tukey post-hoc ใน R:

 #perform the Tukey post-hoc method
TukeyHSD(model, conf. level = .95 )

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = score ~ technique, data = df)

$technical
            diff lwr upr p adj
tech2-tech1 4.2 -1.9700112 10.370011 0.2281369
tech3-tech1 6.4 0.2299888 12.570011 0.0409017
tech3-tech2 2.2 -3.9700112 8.370011 0.6547756

จากผลลัพธ์จะเห็นว่าค่า p เท่านั้น (“ p adj ”) ที่น้อยกว่า 0.05 คือความแตกต่างระหว่างเทคนิคและเทคนิคที่ 3

ดังนั้น เราจะสรุปได้ว่าคะแนนสอบเฉลี่ยระหว่างนักเรียนที่ใช้เทคนิคที่ 1 และเทคนิคที่ 3 มีความแตกต่างที่มีนัยสำคัญทางสถิติเท่านั้น

วิธีเชฟเฟ่

วิธีเชฟเฟอเป็นวิธีการเปรียบเทียบแบบคู่ภายหลังเฉพาะกิจที่อนุรักษ์นิยมมากที่สุด และสร้างช่วงความเชื่อมั่นที่กว้างที่สุดเมื่อเปรียบเทียบค่าเฉลี่ยแบบกลุ่ม

เราสามารถใช้ฟังก์ชัน ScheffeTest() จากแพ็คเกจ DescTools เพื่อรันเมธอด Scheffe post-hoc ใน R:

 library (DescTools)

#perform the Scheffe post-hoc method
ScheffeTest(model)

  Posthoc multiple comparisons of means: Scheffe Test 
    95% family-wise confidence level

$technical
            diff lwr.ci upr.ci pval    
tech2-tech1 4.2 -2.24527202 10.645272 0.2582    
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .  
tech3-tech2 2.2 -4.24527202 8.645272 0.6803    

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1'''156

จากผลการวิจัยพบว่าไม่มีค่า p ใดต่ำกว่า 0.05 จึงสรุปได้ว่าคะแนนสอบเฉลี่ยระหว่างกลุ่มไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติ

วิธีบอนเฟอโรนี

วิธีที่ดีที่สุดคือใช้วิธี Bonferroni เมื่อคุณต้องการดำเนินการชุดการเปรียบเทียบแบบคู่ที่วางแผนไว้

เราสามารถใช้ไวยากรณ์ต่อไปนี้ใน R เพื่อดำเนินการเมธอด Bonferroni post hoc:

 #perform the Bonferroni post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' bonferroni ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.309 -    
tech3 0.048 1.000

P value adjustment method: bonferroni

จากผลลัพธ์จะพบว่าค่า p ที่น้อยกว่า 0.05 เพียงอย่างเดียวคือความแตกต่างระหว่างเทคนิคและเทคนิคที่ 3

ดังนั้น เราจะสรุปได้ว่าคะแนนสอบเฉลี่ยระหว่างนักเรียนที่ใช้เทคนิคที่ 1 และเทคนิคที่ 3 มีความแตกต่างที่มีนัยสำคัญทางสถิติเท่านั้น

วิธีโฮล์ม

วิธีโฮล์มยังใช้เมื่อคุณต้องการดำเนินการชุดการเปรียบเทียบแบบคู่ที่วางแผนไว้ล่วงหน้า และมีแนวโน้มที่จะมีกำลังสูงกว่าวิธี Bonferroni ดังนั้นจึงมักนิยมใช้วิธีนี้

เราสามารถใช้ไวยากรณ์ต่อไปนี้ใน R เพื่อรันเมธอด Holm post-hoc:

 #perform the Holm post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' holm ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.206 -    
tech3 0.048 0.384

P value adjustment method: holm

จากผลลัพธ์จะพบว่าค่า p ที่น้อยกว่า 0.05 เพียงอย่างเดียวคือความแตกต่างระหว่างเทคนิคและเทคนิคที่ 3

ดังนั้น ขอย้ำอีกครั้งว่าคะแนนสอบเฉลี่ยระหว่างนักเรียนที่ใช้เทคนิค 1 และเทคนิค 3 มีความแตกต่างที่มีนัยสำคัญทางสถิติเท่านั้น

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับ ANOVA และการทดสอบหลังการทดสอบ:

วิธีการตีความค่า F และค่า P ใน ANOVA
คู่มือฉบับสมบูรณ์: วิธีรายงานผลลัพธ์ ANOVA
ทูกี้ vs. บอนเฟอโรนี่ vs. Scheffe: คุณควรใช้การทดสอบใด?

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *