คู่มือฉบับสมบูรณ์: วิธีตีความผลลัพธ์ anova ใน r

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 25, 2023 แนะนำ 0 ความคิดเห็น

การวิเคราะห์ความแปรปรวนแบบทางเดียว ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่

บทช่วยสอนนี้ให้คำแนะนำฉบับสมบูรณ์เกี่ยวกับวิธีตีความผลลัพธ์ของการวิเคราะห์ความแปรปรวนแบบทางเดียวใน R

ขั้นตอนที่ 1: สร้างข้อมูล

สมมติว่าเราต้องการตรวจสอบว่าโปรแกรมการฝึกที่แตกต่างกันสามโปรแกรมส่งผลให้น้ำหนักเฉลี่ยของแต่ละบุคคลลดลงหรือไม่

เพื่อทดสอบสิ่งนี้ เรา รับสมัครคน 90 คนเพื่อเข้าร่วมในการทดลอง โดยสุ่มให้คน 30 คนติดตามโปรแกรม A โปรแกรม B หรือโปรแกรม C เป็นเวลาหนึ่งเดือน

รหัสต่อไปนี้จะสร้าง data frame ที่เราจะใช้งานด้วย:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

ขั้นตอนที่ 2: ดำเนินการ ANOVA

ต่อไป เราจะใช้คำสั่ง aov() เพื่อทำการวิเคราะห์ความแปรปรวนแบบทางเดียว:

 #fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)

ขั้นตอนที่ 3: ตีความผลลัพธ์ ANOVA

ต่อไป เราจะใช้คำสั่ง summary() เพื่อแสดงผลการวิเคราะห์ความแปรปรวนแบบทางเดียว:

 #view summary of one-way ANOVA model
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ต่อไปนี้คือวิธีตีความค่าผลลัพธ์แต่ละค่า:

Program Df: องศาอิสระของ โปรแกรม ตัวแปร ซึ่งคำนวณเป็น #groups -1 ในกรณีนี้ มีโปรแกรมการฝึกอบรมที่แตกต่างกัน 3 โปรแกรม ดังนั้นค่านี้คือ: 3-1 = 2

Df Residuals: องศาอิสระของสิ่งตกค้าง ซึ่งคำนวณเป็น #การสังเกตทั้งหมด – #กลุ่ม ในกรณีนี้ มีการสังเกต 90 รายการและ 3 กลุ่ม ดังนั้นค่านี้จึงเป็น: 90 -3 = 87

Program Sum Sq: ผลรวมของกำลังสองที่เกี่ยวข้องกับ โปรแกรม ตัวแปร ค่านี้คือ 98.93

ผลรวมของกำลังสองที่เหลือ: ผลรวมของกำลังสองที่เกี่ยวข้องกับส่วนที่เหลือหรือ “ข้อผิดพลาด” ค่านี้คือ 139.57

สี่เหลี่ยมขนาดกลาง โปรแกรม: ผลรวมเฉลี่ยของกำลังสองที่เกี่ยวข้องกับโปรแกรม ซึ่งคำนวณเป็นผลรวมกำลังสอง โปรแกรม / โปรแกรม Df. ในกรณีนี้ คำนวณเป็น: 98.93 / 2 = 49.46

สี่เหลี่ยมขนาดกลาง ส่วนที่เหลือ: ผลรวมเฉลี่ยของกำลังสองที่เกี่ยวข้องกับส่วนที่เหลือ ซึ่งคำนวณเป็นผลรวมกำลังสอง สารตกค้าง/สารตกค้าง Df. ในกรณีนี้ คำนวณดังนี้: 139.57 / 87 = 1.60

ค่า F: สถิติ F โดยรวมของแบบจำลอง ANOVA ซึ่งคำนวณเป็นกำลังสองเฉลี่ย โปรแกรม / ค่าเฉลี่ยกำลังสอง สารตกค้าง. ในกรณีนี้ คำนวณดังนี้: 49.46 / 1.60 = 30.83

Pr(>F): ค่า p ที่เกี่ยวข้องกับสถิติ F โดยมีตัวเศษ df = 2 และตัวส่วน df = 87 ในกรณีนี้ ค่า p คือ 7.552e-11 ซึ่งเป็นตัวเลขที่น้อยมาก

ค่าที่สำคัญที่สุดในชุดผลลัพธ์คือค่า p เนื่องจากจะบอกเราว่าค่าเฉลี่ยของทั้งสามกลุ่มมีความแตกต่างอย่างมีนัยสำคัญหรือไม่

โปรดจำไว้ว่าการวิเคราะห์ความแปรปรวนทางเดียวใช้สมมติฐานว่างและทางเลือกต่อไปนี้:

H ₀ (สมมติฐานว่าง): ค่าเฉลี่ยกลุ่มทั้งหมดเท่ากัน
H _A (สมมติฐานทางเลือก): ค่าเฉลี่ยกลุ่มอย่างน้อยหนึ่งกลุ่มแตกต่างจากค่าเฉลี่ยอื่นๆ

เนื่องจากค่า p ในตาราง ANOVA ของเรา (.7552e-11) น้อยกว่า 0.05 เราจึงมีหลักฐานเพียงพอที่จะปฏิเสธสมมติฐานที่เป็นโมฆะ

ซึ่งหมายความว่า เรามีหลักฐานเพียงพอที่จะบอกว่าการลดน้ำหนักโดยเฉลี่ยของแต่ละบุคคลไม่เท่ากันระหว่างโปรแกรมการฝึกอบรมทั้งสามโปรแกรม

ขั้นตอนที่ 4: ทำการทดสอบหลังการทดลอง (หากจำเป็น)

หากค่า p ในเอาต์พุต ANOVA น้อยกว่า 0.05 เราจะปฏิเสธสมมติฐานว่าง นี่บอกเราว่าค่าเฉลี่ยระหว่างแต่ละกลุ่มไม่เท่ากัน อย่างไรก็ตาม นี่ไม่ได้บอกเราว่ากลุ่ม ใด มีความแตกต่างกัน

หากต้องการทราบ เราจำเป็นต้องทำการ ทดสอบหลังการทดสอบ ใน R เราสามารถใช้ฟังก์ชัน TukeyHSD() เพื่อทำสิ่งนี้:

 #perform Tukey post-hoc test
TukeyHSD(model)

$program
         diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

ค่า p ที่ปรับแล้วสำหรับความแตกต่างเฉลี่ยระหว่างกลุ่ม A และ B คือ 0.0100545
ค่า p ที่ปรับแล้วสำหรับความแตกต่างเฉลี่ยระหว่างกลุ่ม A และ C คือ 0.0000000
ค่า p ที่ปรับแล้วสำหรับความแตกต่างเฉลี่ยระหว่างกลุ่ม B และ C คือ 0.0000199

เนื่องจากค่า p ที่ปรับแล้วแต่ละค่าน้อยกว่า 0.05 เราจึงสามารถสรุปได้ว่าการลดน้ำหนักโดยเฉลี่ยระหว่าง แต่ละ กลุ่มมีความแตกต่างอย่างมีนัยสำคัญ

แหล่งข้อมูลเพิ่มเติม

ข้อมูลเบื้องต้นเกี่ยวกับการวิเคราะห์ความแปรปรวนแบบทางเดียว
วิธีตรวจสอบสมมติฐาน ANOVA
วิธีดำเนินการวิเคราะห์ความแปรปรวนแบบทางเดียวด้วยตนเอง
เครื่องคิดเลข ANOVA แบบทางเดียว

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม