คู่มือฉบับสมบูรณ์: วิธีตีความผลลัพธ์ anova ใน r
การวิเคราะห์ความแปรปรวนแบบทางเดียว ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่
บทช่วยสอนนี้ให้คำแนะนำฉบับสมบูรณ์เกี่ยวกับวิธีตีความผลลัพธ์ของการวิเคราะห์ความแปรปรวนแบบทางเดียวใน R
ขั้นตอนที่ 1: สร้างข้อมูล
สมมติว่าเราต้องการตรวจสอบว่าโปรแกรมการฝึกที่แตกต่างกันสามโปรแกรมส่งผลให้น้ำหนักเฉลี่ยของแต่ละบุคคลลดลงหรือไม่
เพื่อทดสอบสิ่งนี้ เรา รับสมัครคน 90 คนเพื่อเข้าร่วมในการทดลอง โดยสุ่มให้คน 30 คนติดตามโปรแกรม A โปรแกรม B หรือโปรแกรม C เป็นเวลาหนึ่งเดือน
รหัสต่อไปนี้จะสร้าง data frame ที่เราจะใช้งานด้วย:
#make this example reproducible
set. seeds (0)
#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
weight_loss = c(runif(30, 0, 3),
runif(30, 0, 5),
runif(30, 1, 7)))
#view first six rows of data frame
head(data)
program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458
ขั้นตอนที่ 2: ดำเนินการ ANOVA
ต่อไป เราจะใช้คำสั่ง aov() เพื่อทำการวิเคราะห์ความแปรปรวนแบบทางเดียว:
#fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)
ขั้นตอนที่ 3: ตีความผลลัพธ์ ANOVA
ต่อไป เราจะใช้คำสั่ง summary() เพื่อแสดงผลการวิเคราะห์ความแปรปรวนแบบทางเดียว:
#view summary of one-way ANOVA model
summary(model)
Df Sum Sq Mean Sq F value Pr(>F)
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ต่อไปนี้คือวิธีตีความค่าผลลัพธ์แต่ละค่า:
Program Df: องศาอิสระของ โปรแกรม ตัวแปร ซึ่งคำนวณเป็น #groups -1 ในกรณีนี้ มีโปรแกรมการฝึกอบรมที่แตกต่างกัน 3 โปรแกรม ดังนั้นค่านี้คือ: 3-1 = 2
Df Residuals: องศาอิสระของสิ่งตกค้าง ซึ่งคำนวณเป็น #การสังเกตทั้งหมด – #กลุ่ม ในกรณีนี้ มีการสังเกต 90 รายการและ 3 กลุ่ม ดังนั้นค่านี้จึงเป็น: 90 -3 = 87
Program Sum Sq: ผลรวมของกำลังสองที่เกี่ยวข้องกับ โปรแกรม ตัวแปร ค่านี้คือ 98.93
ผลรวมของกำลังสองที่เหลือ: ผลรวมของกำลังสองที่เกี่ยวข้องกับส่วนที่เหลือหรือ “ข้อผิดพลาด” ค่านี้คือ 139.57
สี่เหลี่ยมขนาดกลาง โปรแกรม: ผลรวมเฉลี่ยของกำลังสองที่เกี่ยวข้องกับโปรแกรม ซึ่งคำนวณเป็นผลรวมกำลังสอง โปรแกรม / โปรแกรม Df. ในกรณีนี้ คำนวณเป็น: 98.93 / 2 = 49.46
สี่เหลี่ยมขนาดกลาง ส่วนที่เหลือ: ผลรวมเฉลี่ยของกำลังสองที่เกี่ยวข้องกับส่วนที่เหลือ ซึ่งคำนวณเป็นผลรวมกำลังสอง สารตกค้าง/สารตกค้าง Df. ในกรณีนี้ คำนวณดังนี้: 139.57 / 87 = 1.60
ค่า F: สถิติ F โดยรวมของแบบจำลอง ANOVA ซึ่งคำนวณเป็นกำลังสองเฉลี่ย โปรแกรม / ค่าเฉลี่ยกำลังสอง สารตกค้าง. ในกรณีนี้ คำนวณดังนี้: 49.46 / 1.60 = 30.83
Pr(>F): ค่า p ที่เกี่ยวข้องกับสถิติ F โดยมีตัวเศษ df = 2 และตัวส่วน df = 87 ในกรณีนี้ ค่า p คือ 7.552e-11 ซึ่งเป็นตัวเลขที่น้อยมาก
ค่าที่สำคัญที่สุดในชุดผลลัพธ์คือค่า p เนื่องจากจะบอกเราว่าค่าเฉลี่ยของทั้งสามกลุ่มมีความแตกต่างอย่างมีนัยสำคัญหรือไม่
โปรดจำไว้ว่าการวิเคราะห์ความแปรปรวนทางเดียวใช้สมมติฐานว่างและทางเลือกต่อไปนี้:
- H 0 (สมมติฐานว่าง): ค่าเฉลี่ยกลุ่มทั้งหมดเท่ากัน
- H A (สมมติฐานทางเลือก): ค่าเฉลี่ยกลุ่มอย่างน้อยหนึ่งกลุ่มแตกต่างจากค่าเฉลี่ยอื่นๆ
เนื่องจากค่า p ในตาราง ANOVA ของเรา (.7552e-11) น้อยกว่า 0.05 เราจึงมีหลักฐานเพียงพอที่จะปฏิเสธสมมติฐานที่เป็นโมฆะ
ซึ่งหมายความว่า เรามีหลักฐานเพียงพอที่จะบอกว่าการลดน้ำหนักโดยเฉลี่ยของแต่ละบุคคลไม่เท่ากันระหว่างโปรแกรมการฝึกอบรมทั้งสามโปรแกรม
ขั้นตอนที่ 4: ทำการทดสอบหลังการทดลอง (หากจำเป็น)
หากค่า p ในเอาต์พุต ANOVA น้อยกว่า 0.05 เราจะปฏิเสธสมมติฐานว่าง นี่บอกเราว่าค่าเฉลี่ยระหว่างแต่ละกลุ่มไม่เท่ากัน อย่างไรก็ตาม นี่ไม่ได้บอกเราว่ากลุ่ม ใด มีความแตกต่างกัน
หากต้องการทราบ เราจำเป็นต้องทำการ ทดสอบหลังการทดสอบ ใน R เราสามารถใช้ฟังก์ชัน TukeyHSD() เพื่อทำสิ่งนี้:
#perform Tukey post-hoc test
TukeyHSD(model)
$program
diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199
ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:
- ค่า p ที่ปรับแล้วสำหรับความแตกต่างเฉลี่ยระหว่างกลุ่ม A และ B คือ 0.0100545
- ค่า p ที่ปรับแล้วสำหรับความแตกต่างเฉลี่ยระหว่างกลุ่ม A และ C คือ 0.0000000
- ค่า p ที่ปรับแล้วสำหรับความแตกต่างเฉลี่ยระหว่างกลุ่ม B และ C คือ 0.0000199
เนื่องจากค่า p ที่ปรับแล้วแต่ละค่าน้อยกว่า 0.05 เราจึงสามารถสรุปได้ว่าการลดน้ำหนักโดยเฉลี่ยระหว่าง แต่ละ กลุ่มมีความแตกต่างอย่างมีนัยสำคัญ
แหล่งข้อมูลเพิ่มเติม
ข้อมูลเบื้องต้นเกี่ยวกับการวิเคราะห์ความแปรปรวนแบบทางเดียว
วิธีตรวจสอบสมมติฐาน ANOVA
วิธีดำเนินการวิเคราะห์ความแปรปรวนแบบทางเดียวด้วยตนเอง
เครื่องคิดเลข ANOVA แบบทางเดียว