ข้อสันนิษฐานความแปรปรวนที่เท่ากันในสถิติคืออะไร?

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 25, 2023 แนะนำ 0 ความคิดเห็น

การทดสอบทางสถิติหลายครั้งทำให้ สมมติฐานของความแปรปรวนเท่ากัน หากไม่ปฏิบัติตามสมมติฐานนี้ ผลการทดสอบจะไม่น่าเชื่อถือ

การทดสอบและขั้นตอนทางสถิติที่พบบ่อยที่สุดที่ทำให้สมมติฐานนี้มีความแปรปรวนเท่ากัน ได้แก่:

1. การวิเคราะห์ความแปรปรวน

2. การทดสอบที

3. การถดถอยเชิงเส้น

บทช่วยสอนนี้จะอธิบายสมมติฐานที่ทำขึ้นสำหรับการทดสอบแต่ละครั้ง วิธีตรวจสอบว่าเป็นไปตามสมมติฐานนั้นหรือไม่ และต้องทำอย่างไรหากมีการละเมิด

สมมติฐานของความเท่าเทียมกันของความแปรปรวนใน ANOVA

การวิเคราะห์ ความแปรปรวน (“การวิเคราะห์ความแปรปรวน”) ใช้เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญระหว่างค่าเฉลี่ยของกลุ่มอิสระสามกลุ่มขึ้นไปหรือไม่

นี่คือตัวอย่างเมื่อเราสามารถใช้ ANOVA ได้:

สมมติว่าเรารับสมัครคน 90 คนเพื่อเข้าร่วมในการทดลองลดน้ำหนัก เราสุ่มให้คน 30 คน ใช้โปรแกรม A B หรือ C เป็นเวลาหนึ่งเดือน

หากต้องการดูว่าโปรแกรมมีผลกระทบต่อการลดน้ำหนักหรือไม่ เราสามารถดำเนิน การวิเคราะห์ความแปรปรวนแบบทางเดียว ได้

การวิเคราะห์ความแปรปรวนจะถือว่าแต่ละกลุ่มมีความแปรปรวนเท่ากัน มีสองวิธีในการทดสอบว่าสมมติฐานนี้เป็นจริงหรือไม่:

1. สร้างแปลงกล่อง

Boxplots นำเสนอวิธีการตรวจสอบสมมติฐานของความเท่าเทียมกันของความแปรปรวนด้วยภาพ

ความแปรปรวนของการลดน้ำหนักในแต่ละกลุ่มสามารถสังเกตได้จากความยาวของแต่ละบ็อกซ์พล็อต ยิ่งกล่องยาว ความแปรปรวนก็จะยิ่งสูงขึ้น ตัวอย่างเช่น เราจะเห็นว่าความแปรปรวนจะสูงขึ้นเล็กน้อยสำหรับผู้เข้าร่วมในโปรแกรม C เมื่อเปรียบเทียบกับโปรแกรม A และโปรแกรม B

2. ทำการทดสอบ Bartlett

การทดสอบ Bartlett จะทดสอบสมมติฐานว่างที่ว่ากลุ่มตัวอย่างมีความแปรปรวนเท่ากัน เทียบกับสมมติฐานทางเลือกที่ว่ากลุ่มตัวอย่างมีความแปรปรวนไม่เท่ากัน

หากค่า p ของการทดสอบต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น 0.05) เราก็มีหลักฐานว่าตัวอย่างทั้งหมดไม่ได้มีความแปรปรวนเท่ากัน

จะเกิดอะไรขึ้นหากไม่เป็นไปตามสมมติฐานของความแปรปรวนที่เท่ากัน?

โดยทั่วไป ANOVA จะถือว่าค่อนข้างแข็งแกร่งต่อการละเมิดสมมติฐานความแปรปรวนที่เท่ากัน ตราบใดที่แต่ละกลุ่มมีขนาดตัวอย่างเท่ากัน

อย่างไรก็ตาม หากขนาดตัวอย่างไม่เท่ากันและข้อสันนิษฐานนี้ถูกละเมิดอย่างรุนแรง คุณสามารถเรียกใช้ การทดสอบ Kruskal-Wallis แทน ซึ่งเป็นเวอร์ชัน ANOVA แบบไม่มีพารามิเตอร์

สมมติฐานของความแปรปรวนที่เท่ากันในการทดสอบที

การทดสอบทีแบบสองตัวอย่าง ใช้เพื่อทดสอบว่าค่าเฉลี่ยของประชากรทั้งสองเท่ากันหรือไม่

การทดสอบจะถือว่าความแปรปรวนระหว่างทั้งสองกลุ่มเท่ากัน มีสองวิธีในการทดสอบว่าสมมติฐานนี้เป็นจริงหรือไม่:

1. ใช้กฎอัตราส่วนง่ายๆ

โดยทั่วไป หากอัตราส่วนของความแปรปรวนที่ใหญ่ที่สุดต่อความแปรปรวนที่น้อยที่สุดน้อยกว่า 4 เราก็สามารถสรุปได้ว่าความแปรปรวนนั้นเท่ากันโดยประมาณ และใช้การทดสอบแบบสองตัวอย่าง

ตัวอย่างเช่น สมมติว่าตัวอย่างที่ 1 มีความแปรปรวน 24.5 และตัวอย่างที่ 2 มีความแปรปรวน 15.2 อัตราส่วนของความแปรปรวนตัวอย่างที่ใหญ่ที่สุดต่อความแปรปรวนตัวอย่างที่น้อยที่สุดจะถูกคำนวณเป็น: 24.5 / 15.2 = 1.61

อัตราส่วนนี้น้อยกว่า 4 อาจสันนิษฐานได้ว่าความแตกต่างระหว่างทั้งสองกลุ่มมีค่าเท่ากันโดยประมาณ

2. ทำการทดสอบ F

การทดสอบ F จะทดสอบสมมติฐานว่างที่ว่าตัวอย่างมีความแปรปรวนเท่ากัน เทียบกับสมมติฐานทางเลือกที่ว่าตัวอย่างมีความแปรปรวนไม่เท่ากัน

จะเกิดอะไรขึ้นหากไม่เป็นไปตามสมมติฐานของความแปรปรวนที่เท่ากัน?

หากสมมติฐานนี้ถูกละเมิด เราก็สามารถทำการทดสอบ t-test ของ Welch ได้ ซึ่งเป็นเวอร์ชันที่ไม่ใช่พารามิเตอร์ของการทดสอบ t-test สองตัวอย่าง และไม่ได้ถือว่าทั้งสองตัวอย่างมีความแปรปรวนเท่ากัน

สมมติฐานความแปรปรวนเท่ากันในการถดถอยเชิงเส้น

การถดถอยเชิงเส้น ใช้เพื่อหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายหนึ่งตัวขึ้นไปกับตัวแปรตอบสนอง

การถดถอยเชิงเส้นถือว่า ส่วนที่เหลือ มีความแปรปรวนคงที่ในแต่ละระดับของตัวแปรทำนาย สิ่งนี้เรียกว่า การรักร่วมเพศ เมื่อไม่เป็นเช่นนั้น สารตกค้างจะได้รับผลกระทบจาก ความไม่สมดุล และผลลัพธ์ของการวิเคราะห์การถดถอยจะไม่น่าเชื่อถือ

วิธีที่พบบ่อยที่สุดในการพิจารณาว่าเป็นไปตามสมมติฐานนี้คือการสร้างพล็อตของค่าคงเหลือเทียบกับค่าที่ติดตั้งไว้ หากส่วนที่เหลือในกราฟนี้ดูเหมือนจะกระจัดกระจายแบบสุ่มรอบๆ ศูนย์ ก็อาจเป็นไปตามสมมติฐานของความเป็นเนื้อเดียวกัน

อย่างไรก็ตาม หากมีแนวโน้มที่เป็นระบบในส่วนที่เหลือ เช่น รูปร่าง “กรวย” ในกราฟต่อไปนี้ ความเป็นเฮเทอโรสเคดาสติกก็จะเป็นปัญหา:

จะเกิดอะไรขึ้นหากไม่เป็นไปตามสมมติฐานของความแปรปรวนที่เท่ากัน?

หากสมมติฐานนี้ถูกละเมิด วิธีที่พบบ่อยที่สุดในการแก้ปัญหาคือการแปลงตัวแปรการตอบสนองโดยใช้การแปลงแบบใดแบบหนึ่งจากสามแบบ:

1. การแปลงบันทึก: แปลงตัวแปรการตอบสนองจาก y เป็น log(y)

2. การแปลงรากที่สอง: แปลงตัวแปรตอบสนองจาก y เป็น √y

3. การแปลงรากที่สาม: แปลงตัวแปรการตอบสนองจาก y เป็น y ^1/3

เมื่อทำการแปลงเหล่านี้ ปัญหาของความเหลื่อมล้ำโดยทั่วไปจะหายไป

อีกวิธีหนึ่งในการแก้ไขค่าความแตกต่างแบบเฮเทอโรสเคดาสติกคือการใช้ การถดถอยกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก การถดถอยประเภทนี้จะกำหนดน้ำหนักให้กับจุดข้อมูลแต่ละจุดโดยพิจารณาจากความแปรปรวนของค่าที่พอดี

โดยพื้นฐานแล้ว สิ่งนี้จะให้น้ำหนักที่ต่ำแก่จุดข้อมูลที่มีความแปรปรวนสูงกว่า ช่วยลดกำลังสองที่เหลือ เมื่อใช้ตุ้มน้ำหนักที่เหมาะสม สิ่งนี้สามารถขจัดปัญหาความไม่สมดุลได้

แหล่งข้อมูลเพิ่มเติม

สมมติฐานทั้งสามนี้จัดทำขึ้นใน ANOVA
สมมติฐานทั้งสี่นี้กำหนดขึ้นในการทดสอบ T
สมมติฐานสี่ประการของการถดถอยเชิงเส้น

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม

สมมติฐานของความเท่าเทียมกันของความแปรปรวนใน ANOVA

สมมติฐานของความแปรปรวนที่เท่ากันในการทดสอบที

สมมติฐานความแปรปรวนเท่ากันในการถดถอยเชิงเส้น

แหล่งข้อมูลเพิ่มเติม

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

เพิ่มความคิดเห็น