ข้อสันนิษฐานความแปรปรวนที่เท่ากันในสถิติคืออะไร?
การทดสอบทางสถิติหลายครั้งทำให้ สมมติฐานของความแปรปรวนเท่ากัน หากไม่ปฏิบัติตามสมมติฐานนี้ ผลการทดสอบจะไม่น่าเชื่อถือ
การทดสอบและขั้นตอนทางสถิติที่พบบ่อยที่สุดที่ทำให้สมมติฐานนี้มีความแปรปรวนเท่ากัน ได้แก่:
1. การวิเคราะห์ความแปรปรวน
2. การทดสอบที
3. การถดถอยเชิงเส้น
บทช่วยสอนนี้จะอธิบายสมมติฐานที่ทำขึ้นสำหรับการทดสอบแต่ละครั้ง วิธีตรวจสอบว่าเป็นไปตามสมมติฐานนั้นหรือไม่ และต้องทำอย่างไรหากมีการละเมิด
สมมติฐานของความเท่าเทียมกันของความแปรปรวนใน ANOVA
การวิเคราะห์ ความแปรปรวน (“การวิเคราะห์ความแปรปรวน”) ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่
นี่คือตัวอย่างเมื่อเราสามารถใช้ ANOVA ได้:
สมมติว่าเรารับสมัครคน 90 คนเพื่อเข้าร่วมในการทดลองลดน้ำหนัก เราสุ่มให้คน 30 คน ใช้โปรแกรม A B หรือ C เป็นเวลาหนึ่งเดือน
หากต้องการดูว่าโปรแกรมมีผลกระทบต่อการลดน้ำหนักหรือไม่ เราสามารถดำเนิน การวิเคราะห์ความแปรปรวนแบบทางเดียว ได้
การวิเคราะห์ความแปรปรวนจะถือว่าแต่ละกลุ่มมีความแปรปรวนเท่ากัน มีสองวิธีในการทดสอบว่าสมมติฐานนี้เป็นจริงหรือไม่:
1. สร้างแปลงกล่อง
Boxplots นำเสนอวิธีการตรวจสอบสมมติฐานของความเท่าเทียมกันของความแปรปรวนด้วยภาพ
ความแปรปรวนของการลดน้ำหนักในแต่ละกลุ่มสามารถสังเกตได้จากความยาวของแต่ละบ็อกซ์พล็อต ยิ่งกล่องยาว ความแปรปรวนก็จะยิ่งสูงขึ้น ตัวอย่างเช่น เราจะเห็นว่าความแปรปรวนจะสูงขึ้นเล็กน้อยสำหรับผู้เข้าร่วมในโปรแกรม C เมื่อเปรียบเทียบกับโปรแกรม A และโปรแกรม B
2. ทำการทดสอบ Bartlett
การทดสอบ Bartlett จะทดสอบสมมติฐานว่างที่ว่ากลุ่มตัวอย่างมีความแปรปรวนเท่ากัน เทียบกับสมมติฐานทางเลือกที่ว่ากลุ่มตัวอย่างมีความแปรปรวนไม่เท่ากัน
หากค่า p ของการทดสอบต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น 0.05) เราก็มีหลักฐานว่าตัวอย่างทั้งหมดไม่ได้มีความแปรปรวนเท่ากัน
จะเกิดอะไรขึ้นหากไม่เป็นไปตามสมมติฐานของความแปรปรวนที่เท่ากัน?
โดยทั่วไป ANOVA จะถือว่าค่อนข้างแข็งแกร่งต่อการละเมิดสมมติฐานความแปรปรวนที่เท่ากัน ตราบใดที่แต่ละกลุ่มมีขนาดตัวอย่างเท่ากัน
อย่างไรก็ตาม หากขนาดตัวอย่างไม่เท่ากันและข้อสันนิษฐานนี้ถูกละเมิดอย่างรุนแรง คุณสามารถเรียกใช้ การทดสอบ Kruskal-Wallis แทน ซึ่งเป็นเวอร์ชัน ANOVA แบบไม่มีพารามิเตอร์
สมมติฐานของความแปรปรวนที่เท่ากันในการทดสอบที
การทดสอบทีแบบสองตัวอย่าง ใช้เพื่อทดสอบว่าค่าเฉลี่ยของประชากรทั้งสองเท่ากันหรือไม่
การทดสอบจะถือว่าความแปรปรวนระหว่างทั้งสองกลุ่มเท่ากัน มีสองวิธีในการทดสอบว่าสมมติฐานนี้เป็นจริงหรือไม่:
1. ใช้กฎอัตราส่วนง่ายๆ
โดยทั่วไป หากอัตราส่วนของความแปรปรวนที่ใหญ่ที่สุดต่อความแปรปรวนที่น้อยที่สุดน้อยกว่า 4 เราก็สามารถสรุปได้ว่าความแปรปรวนนั้นเท่ากันโดยประมาณ และใช้การทดสอบแบบสองตัวอย่าง
ตัวอย่างเช่น สมมติว่าตัวอย่างที่ 1 มีความแปรปรวน 24.5 และตัวอย่างที่ 2 มีความแปรปรวน 15.2 อัตราส่วนของความแปรปรวนตัวอย่างที่ใหญ่ที่สุดต่อความแปรปรวนตัวอย่างที่น้อยที่สุดจะถูกคำนวณเป็น: 24.5 / 15.2 = 1.61
อัตราส่วนนี้น้อยกว่า 4 อาจสันนิษฐานได้ว่าความแตกต่างระหว่างทั้งสองกลุ่มมีค่าเท่ากันโดยประมาณ
2. ทำการทดสอบ F
การทดสอบ F จะทดสอบสมมติฐานว่างที่ว่าตัวอย่างมีความแปรปรวนเท่ากัน เทียบกับสมมติฐานทางเลือกที่ว่าตัวอย่างมีความแปรปรวนไม่เท่ากัน
หากค่า p ของการทดสอบต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น 0.05) เราก็มีหลักฐานว่าตัวอย่างทั้งหมดไม่ได้มีความแปรปรวนเท่ากัน
จะเกิดอะไรขึ้นหากไม่เป็นไปตามสมมติฐานของความแปรปรวนที่เท่ากัน?
หากสมมติฐานนี้ถูกละเมิด เราก็สามารถทำการทดสอบ t-test ของ Welch ได้ ซึ่งเป็นเวอร์ชันที่ไม่ใช่พารามิเตอร์ของการทดสอบ t-test สองตัวอย่าง และไม่ได้ถือว่าทั้งสองตัวอย่างมีความแปรปรวนเท่ากัน
สมมติฐานความแปรปรวนเท่ากันในการถดถอยเชิงเส้น
การถดถอยเชิงเส้น ใช้เพื่อหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายหนึ่งตัวขึ้นไปกับตัวแปรตอบสนอง
การถดถอยเชิงเส้นถือว่า ส่วนที่เหลือ มีความแปรปรวนคงที่ในแต่ละระดับของตัวแปรทำนาย สิ่งนี้เรียกว่า การรักร่วมเพศ เมื่อไม่เป็นเช่นนั้น สารตกค้างจะได้รับผลกระทบจาก ความไม่สมดุล และผลลัพธ์ของการวิเคราะห์การถดถอยจะไม่น่าเชื่อถือ
วิธีที่พบบ่อยที่สุดในการพิจารณาว่าเป็นไปตามสมมติฐานนี้คือการสร้างพล็อตของค่าคงเหลือเทียบกับค่าที่ติดตั้งไว้ หากส่วนที่เหลือในกราฟนี้ดูเหมือนจะกระจัดกระจายแบบสุ่มรอบๆ ศูนย์ ก็อาจเป็นไปตามสมมติฐานของความเป็นเนื้อเดียวกัน
อย่างไรก็ตาม หากมีแนวโน้มที่เป็นระบบในส่วนที่เหลือ เช่น รูปร่าง “กรวย” ในกราฟต่อไปนี้ ความเป็นเฮเทอโรสเคดาสติกก็จะเป็นปัญหา:
จะเกิดอะไรขึ้นหากไม่เป็นไปตามสมมติฐานของความแปรปรวนที่เท่ากัน?
หากสมมติฐานนี้ถูกละเมิด วิธีที่พบบ่อยที่สุดในการแก้ปัญหาคือการแปลงตัวแปรการตอบสนองโดยใช้การแปลงแบบใดแบบหนึ่งจากสามแบบ:
1. การแปลงบันทึก: แปลงตัวแปรการตอบสนองจาก y เป็น log(y)
2. การแปลงรากที่สอง: แปลงตัวแปรตอบสนองจาก y เป็น √y
3. การแปลงรากที่สาม: แปลงตัวแปรการตอบสนองจาก y เป็น y 1/3
เมื่อทำการแปลงเหล่านี้ ปัญหาของความเหลื่อมล้ำโดยทั่วไปจะหายไป
อีกวิธีหนึ่งในการแก้ไขค่าความแตกต่างแบบเฮเทอโรสเคดาสติกคือการใช้ การถดถอยกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก การถดถอยประเภทนี้จะกำหนดน้ำหนักให้กับจุดข้อมูลแต่ละจุดโดยพิจารณาจากความแปรปรวนของค่าที่พอดี
โดยพื้นฐานแล้ว สิ่งนี้จะให้น้ำหนักที่ต่ำแก่จุดข้อมูลที่มีความแปรปรวนสูงกว่า ช่วยลดกำลังสองที่เหลือ เมื่อใช้ตุ้มน้ำหนักที่เหมาะสม สิ่งนี้สามารถขจัดปัญหาความไม่สมดุลได้
แหล่งข้อมูลเพิ่มเติม
สมมติฐานทั้งสามนี้จัดทำขึ้นใน ANOVA
สมมติฐานทั้งสี่นี้กำหนดขึ้นในการทดสอบ T
สมมติฐานสี่ประการของการถดถอยเชิงเส้น
