การทดสอบไคสแควร์
บทความนี้จะอธิบายว่าการทดสอบไคสแควร์ในสถิติคืออะไร และใช้เพื่ออะไร นอกจากนี้คุณยังจะได้ค้นพบวิธีทำแบบทดสอบไคสแควร์และแบบฝึกหัดที่แก้ไขทีละขั้นตอน
การทดสอบไคสแควร์คืออะไร?
การทดสอบไคสแควร์ เป็นการทดสอบทางสถิติที่ใช้ในการพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างความถี่ที่คาดหวังกับความถี่ที่สังเกตได้หรือไม่
ตามหลักเหตุผลแล้ว สถิติการทดสอบไคสแควร์เป็นไปตาม การแจกแจงไคสแควร์ ดังนั้นค่าของสถิติการทดสอบจึงต้องเปรียบเทียบกับค่าเฉพาะของการแจกแจงไคสแควร์ ด้านล่างนี้เราจะดูว่าการทดสอบไคสแควร์ดำเนินการอย่างไร
การทดสอบทางสถิติประเภทนี้เรียกอีกอย่างว่า การทดสอบไคสแควร์ของเพียร์สัน และบางครั้งแสดงด้วยสัญลักษณ์ของการแจกแจงไคสแควร์: χ² test
สูตรทดสอบไคสแควร์
สถิติการทดสอบไคสแควร์เท่ากับผลรวมของกำลังสองของความแตกต่างระหว่างค่าที่สังเกตได้กับค่าที่คาดหวังหารด้วยค่าที่คาดหวัง
ดังนั้น สูตรของการทดสอบไคสแควร์ คือ:
ทอง:
-
คือสถิติการทดสอบไคสแควร์ ซึ่งตามหลังการแจกแจงไคสแควร์ด้วย
ระดับความอิสระ.
-
คือขนาดตัวอย่างข้อมูล
-
คือค่าที่สังเกตได้ของข้อมูล i
-
คือค่าที่คาดหวังสำหรับข้อมูล i
สมมติฐานว่างของสมมติฐานที่ทดสอบการทดสอบไคสแควร์คือค่าที่สังเกตได้นั้นเทียบเท่ากับค่าที่คาดหวัง ในทางกลับกัน สมมติฐานทางเลือกของการทดสอบคือค่าที่สังเกตค่าใดค่าหนึ่งแตกต่างจากค่าที่คาดไว้
จึงถือว่ามีนัยสำคัญในระดับหนึ่ง
ควรเปรียบเทียบสถิติการทดสอบที่คำนวณได้กับค่าการทดสอบวิกฤตเพื่อพิจารณาว่าจะปฏิเสธสมมติฐานว่างหรือสมมติฐานทางเลือก:
- หากสถิติการทดสอบน้อยกว่าค่าวิกฤต
สมมติฐานทางเลือกถูกปฏิเสธ (และยอมรับสมมติฐานว่าง)
- หากสถิติการทดสอบมากกว่าค่าวิกฤต
สมมติฐานว่างถูกปฏิเสธ (และยอมรับสมมติฐานทางเลือก)
ตัวอย่างการทดสอบไคสแควร์
เมื่อเราได้เห็นคำจำกัดความของการทดสอบไคสแควร์แล้วและสูตรของมันคืออะไร เราจะแสดงตัวอย่างการแก้ปัญหาทีละขั้นตอนด้านล่างเพื่อให้คุณเห็นว่าการทดสอบทางสถิติประเภทนี้ดำเนินการอย่างไร
- เจ้าของร้านค้ากล่าวว่า 50% ของยอดขายของเขาสำหรับผลิตภัณฑ์ A, 35% ของยอดขายของเขาสำหรับผลิตภัณฑ์ B และ 15% ของยอดขายของเขาสำหรับผลิตภัณฑ์ C อย่างไรก็ตาม หน่วยที่ขายของผลิตภัณฑ์แต่ละรายการคือหน่วยที่แสดงไว้ ใน ตารางฉุกเฉิน ต่อไปนี้ วิเคราะห์ว่าข้อมูลทางทฤษฎีของเจ้าของมีความแตกต่างทางสถิติจากข้อมูลจริงที่รวบรวมหรือไม่
ผลิตภัณฑ์ | ยอดขายที่สังเกตได้ (O i ) |
---|---|
สินค้า ก | 453 |
สินค้าบี | 268 |
สินค้า ค | 79 |
ทั้งหมด | 800 |
ขั้นแรกเราต้องคำนวณค่าที่เจ้าของร้านคาดหวัง ในการดำเนินการนี้ เราจะคูณเปอร์เซ็นต์ของยอดขายที่คาดหวังของแต่ละผลิตภัณฑ์ด้วยจำนวนยอดขายทั้งหมดที่ทำได้:
ดังนั้น ตารางการกระจายความถี่ ของปัญหาจึงเป็นดังนี้
ผลิตภัณฑ์ | ยอดขายที่สังเกตได้ (O i ) | ยอดขายที่คาดหวัง (E i ) |
---|---|---|
สินค้า ก | 453 | 400 |
สินค้าบี | 268 | 280 |
สินค้า ค | 79 | 120 |
ทั้งหมด | 800 | 800 |
ตอนนี้เราได้คำนวณค่าทั้งหมดแล้ว เราใช้สูตรการทดสอบไคสแควร์เพื่อคำนวณสถิติการทดสอบ:
เมื่อคำนวณค่าของสถิติการทดสอบแล้ว เราจะใช้ตารางการแจกแจงไคสแควร์เพื่อค้นหาค่าวิกฤตของการทดสอบ การกระจายไคสแควร์มี
ระดับความเป็นอิสระ ดังนั้น หากเราเลือกระดับความสำคัญ
ค่าวิกฤติของการทดสอบมีดังนี้:
ดังนั้นสถิติการทดสอบ (21.53) มากกว่าค่าการทดสอบวิกฤต (5.991) ดังนั้นสมมติฐานว่างจึงถูกปฏิเสธและยอมรับสมมติฐานทางเลือก ซึ่งหมายความว่าข้อมูลแตกต่างกันมาก ดังนั้นเจ้าของร้านค้าจึงคาดหวังยอดขายที่แตกต่างจากที่เกิดขึ้นจริง
การตีความการทดสอบไคสแควร์
การตีความการทดสอบไคสแควร์ ไม่สามารถทำได้เพียงผลการทดสอบที่ได้รับ แต่ต้องเปรียบเทียบกับค่าวิกฤตของการทดสอบ
ตามตรรกะ ยิ่งค่าของสถิติการทดสอบที่คำนวณได้น้อยลง ข้อมูลที่สังเกตได้ก็จะคล้ายกับข้อมูลที่คาดไว้มากขึ้นเท่านั้น ดังนั้นหากผลการทดสอบไคสแควร์เป็น 0 แสดงว่าค่าที่สังเกตได้และค่าที่คาดหวังนั้นเหมือนกันทุกประการ ในทางกลับกัน ยิ่งผลการทดสอบมากก็หมายความว่ายิ่งค่าที่สังเกตได้แตกต่างไปจากค่าที่คาดไว้มากเท่านั้น
อย่างไรก็ตาม ในการตัดสินใจว่าชุดข้อมูลทั้งสองชุดมีความแตกต่างกันทางสถิติหรือเท่ากัน เราจะต้องเปรียบเทียบค่าการทดสอบที่คำนวณได้กับค่าการทดสอบวิกฤต เพื่อที่จะปฏิเสธสมมติฐานว่างหรือสมมติฐานทางเลือกของความแตกต่าง หากสถิติการทดสอบน้อยกว่าค่าวิกฤตของการแจกแจง สมมติฐานทางเลือกจะถูกปฏิเสธ ในทางกลับกัน หากสถิติการทดสอบมากกว่าค่าวิกฤตของการแจกแจง สมมติฐานว่างจะถูกปฏิเสธ