วิธีดำเนินการวิเคราะห์ความแปรปรวนแบบทางเดียวใน stata
การวิเคราะห์ความแปรปรวนแบบทางเดียว ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่
การทดสอบประเภทนี้เรียกว่าการวิเคราะห์ความแปรปรวน แบบทางเดียว เนื่องจากเราวิเคราะห์ผลกระทบ ของ ตัวแปรทำนายต่อตัวแปรตอบสนอง หากเราสนใจผลกระทบของตัวแปรทำนายสองตัวที่มีต่อตัวแปรตอบสนองแทน เราก็สามารถดำเนิน การวิเคราะห์ความแปรปรวน แบบสองทางได้
บทช่วยสอนนี้จะอธิบายวิธีดำเนินการ ANOVA แบบทางเดียวใน Stata
ตัวอย่าง: การวิเคราะห์ความแปรปรวนแบบทางเดียวใน Stata
ในตัวอย่างนี้ เราจะใช้ชุดข้อมูล Stata ในตัวที่เรียกว่า systolic เพื่อทำการวิเคราะห์ความแปรปรวนแบบทางเดียว ชุดข้อมูลนี้ประกอบด้วยตัวแปร 3 ตัวต่อไปนี้สำหรับบุคคล 58 คน:
- ยาที่ใช้
- ความเจ็บป่วยของผู้ป่วย
- การเปลี่ยนแปลงความดันโลหิตซิสโตลิก
เราจะใช้ขั้นตอนต่อไปนี้เพื่อทำการวิเคราะห์ความแปรปรวนทางเดียวเพื่อตรวจสอบว่าประเภทของยาที่ใช้ส่งผลกระทบอย่างมีนัยสำคัญต่อการเปลี่ยนแปลงของความดันโลหิตซิสโตลิกหรือไม่
ขั้นตอนที่ 1: โหลดข้อมูล
ขั้นแรก โหลดข้อมูลโดยพิมพ์ webuse systolic ในกล่องคำสั่งแล้วคลิก Enter
ขั้นตอนที่ 2: ดูข้อมูลดิบ
ก่อนที่จะดำเนินการวิเคราะห์ความแปรปรวนแบบทางเดียว เรามาดูข้อมูลดิบกันก่อน จากแถบเมนูด้านบน ไปที่ ข้อมูล > ตัวแก้ไขข้อมูล > ตัวแก้ไขข้อมูล (เรียกดู) นี่จะแสดงข้อมูลจริงของผู้ป่วยทั้งหมด 58 ราย:
ขั้นตอนที่ 3: แสดงภาพข้อมูล
ต่อไป เรามาแสดงภาพข้อมูลกัน เราจะจัดทำ Box Plot เพื่อแสดงการกระจายค่าความดันโลหิตซิสโตลิกสำหรับยาแต่ละประเภท
จากแถบเมนูด้านบน ไปที่ แผนภูมิ > พล็อตกล่อง ภายใต้ตัวแปร ให้เลือก Systolic:
จากนั้นในหัวข้อย่อยหมวดหมู่ภายใต้ตัวแปรการจัดกลุ่ม ให้เลือกยา:
คลิก ตกลง แผนภูมิที่มี Boxplot สี่จุดจะแสดงโดยอัตโนมัติ:
เราจะเห็นได้ทันทีว่าการกระจายตัวของการเปลี่ยนแปลงของความดันโลหิตซิสโตลิกแตกต่างกันไปตามประเภทของยา แต่การวิเคราะห์ความแปรปรวนแบบทางเดียวจะบอกเราว่าความแตกต่างเหล่านี้มีนัยสำคัญทางสถิติหรือไม่
ขั้นตอนที่ 4: ดำเนินการวิเคราะห์ความแปรปรวนแบบทางเดียว
จากแถบเมนูด้านบน ไปที่ สถิติ > โมเดลเชิงเส้นและที่เกี่ยวข้อง > ANOVA/MANOVA > การวิเคราะห์ความแปรปรวนทางเดียว
ภายใต้ตัวแปรการตอบสนอง ให้เลือก Systolic ภายใต้ตัวแปรปัจจัย ให้เลือกยา จากนั้นคลิกช่องถัดจาก สร้างตารางสรุป เพื่อให้เราดูสถิติเชิงพรรณนาพื้นฐานสำหรับแต่ละกลุ่มได้ จากนั้นคลิก ตกลง
ผลลัพธ์ต่อไปนี้จะปรากฏขึ้น:
สถิติ F คือ 9.09 และค่า p ที่สอดคล้องกันคือ 0.0001 เนื่องจากค่า p น้อยกว่า alpha = 0.05 เราจึงสามารถปฏิเสธสมมติฐานว่างที่ว่าค่าเฉลี่ยการเปลี่ยนแปลงของความดันโลหิตซิสโตลิกในแต่ละกลุ่มเท่ากัน
กล่าวอีกนัยหนึ่ง มีความแตกต่างอย่างมีนัยสำคัญทางสถิติในการเปลี่ยนแปลงเฉลี่ยของความดันโลหิตซิสโตลิกระหว่างกลุ่มยาอย่างน้อยสองกลุ่ม
ขั้นตอนที่ 5: เรียกใช้การทดสอบเปรียบเทียบหลายรายการ
จากนั้นเราจะทำการทดสอบเปรียบเทียบหลายๆ ครั้งเพื่อดูว่าค่าเฉลี่ยของกลุ่มใดที่แตกต่างกัน
จากแถบเมนูด้าน บน ไปที่ สถิติ > สรุป ตาราง และการทดสอบ > สถิติสรุปและเชิงพรรณนา > การเปรียบเทียบค่าเฉลี่ยแบบคู่
สำหรับตัวแปร ให้เลือกตัวแปรการตอบสนอง Systolic สำหรับ Over ให้เลือก ยา ที่มีตัวแปรอธิบาย สำหรับการปรับเปลี่ยนสำหรับการเปรียบเทียบหลายรายการ ให้เลือก วิธี Tukey
จากนั้น ใต้หัวข้อย่อย การรายงาน ให้คลิกปุ่มถัดจาก ตารางผลกระทบ และทำเครื่องหมายที่ช่องถัดจาก แสดงตารางผลกระทบพร้อมช่วงความเชื่อมั่นและค่า p จากนั้นคลิก ตกลง
ผลลัพธ์ต่อไปนี้จะปรากฏขึ้น:
แต่ละแถวแสดงถึงการเปรียบเทียบระหว่างกลุ่มยาเฉพาะสองกลุ่ม ตัวอย่างเช่น แถวแรกเปรียบเทียบการเปลี่ยนแปลงโดยเฉลี่ยของความดันโลหิตซิสโตลิกระหว่างกลุ่มยาที่ 2 และกลุ่มยาที่ 1 ค่า p-value สำหรับการเปรียบเทียบนี้คือ 0.999 ซึ่งสูงมากและไม่ต่ำกว่า 0.05 ซึ่งหมายความว่าไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างกลุ่มยา 1 และ 2
อย่างไรก็ตาม เราจะเห็นว่าค่า p สำหรับการเปรียบเทียบต่อไปนี้น้อยกว่า 0.05 ทั้งหมด:
- ยา 3 ต่อ 1 | ค่า p = 0.001
- ยา 4 ต่อ 1 | ค่า p = 0.010
- ยา 3 ต่อ 2 | ค่า p = 0.001
- ยา 4 ต่อ 2 | ค่า p = 0.015
ซึ่งหมายความว่าความแตกต่างในการเปลี่ยนแปลงเฉลี่ยของความดันโลหิตซิสโตลิกมีนัยสำคัญทางสถิติระหว่างแต่ละกลุ่มเหล่านี้
ขั้นตอนที่ 6: รายงานผลลัพธ์
สุดท้ายนี้ เราจะรายงานผลลัพธ์ของการวิเคราะห์ความแปรปรวนแบบทางเดียวของเรา นี่คือตัวอย่างของวิธีการทำเช่นนี้:
มีการดำเนินการวิเคราะห์ความแปรปรวนแบบทางเดียวเพื่อตรวจสอบว่ายาสี่ประเภทที่แตกต่างกันมีผลกระทบต่อความดันโลหิตซิสโตลิกที่แตกต่างกันหรือไม่
ตารางต่อไปนี้สรุปจำนวนผู้เข้าร่วมในแต่ละกลุ่ม รวมถึงการเปลี่ยนแปลงเฉลี่ยของความดันโลหิตซิสโตลิก และค่าเบี่ยงเบนมาตรฐานของความดันโลหิตซิสโตลิกสำหรับแต่ละกลุ่ม:
การวิเคราะห์ความแปรปรวนแบบทางเดียวเปิดเผยว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างอย่างน้อยสองกลุ่ม (F(3, 54) = 9.09, p = 0.001)
การทดสอบของทูคีย์สำหรับการเปรียบเทียบหลายรายการพบว่าการเปลี่ยนแปลงของความดันโลหิตซิสโตลิกสูงขึ้นอย่างมีนัยสำคัญทางสถิติสำหรับยา 3 มากกว่ายา 1 (17.32 +/- 4.15, p = 0.001) สำหรับยา 3 เมื่อเทียบกับยา 2 (16.78 +/- 4.15, p = 0.001) สำหรับยา 4 เปรียบเทียบกับยา 1 (12.57 +/- 3.85, p = 0.010) และสำหรับยา 4 เปรียบเทียบกับยา 2 (12.03 +/- 3.85, p = 0.015)
ไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างกลุ่มยาที่ 1 และ 2 (0.533 +/- 3.91, p = 0.999) หรือระหว่างกลุ่มยาที่ 3 และ 4 (4.75 +/- 4.09, p = 0.654)