การทดสอบไคสแควร์
บทความนี้จะอธิบายว่าการทดสอบไคสแควร์ในสถิติคืออะไร และใช้เพื่ออะไร นอกจากนี้คุณยังจะได้ค้นพบวิธีทำแบบทดสอบไคสแควร์และแบบฝึกหัดที่แก้ไขทีละขั้นตอน
การทดสอบไคสแควร์คืออะไร?
การทดสอบไคสแควร์ เป็นการทดสอบทางสถิติที่ใช้ในการพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างความถี่ที่คาดหวังกับความถี่ที่สังเกตได้หรือไม่
ตามหลักเหตุผลแล้ว สถิติการทดสอบไคสแควร์เป็นไปตาม การแจกแจงไคสแควร์ ดังนั้นค่าของสถิติการทดสอบจึงต้องเปรียบเทียบกับค่าเฉพาะของการแจกแจงไคสแควร์ ด้านล่างนี้เราจะดูว่าการทดสอบไคสแควร์ดำเนินการอย่างไร
การทดสอบทางสถิติประเภทนี้เรียกอีกอย่างว่า การทดสอบไคสแควร์ของเพียร์สัน และบางครั้งแสดงด้วยสัญลักษณ์ของการแจกแจงไคสแควร์: χ² test
สูตรทดสอบไคสแควร์
สถิติการทดสอบไคสแควร์เท่ากับผลรวมของกำลังสองของความแตกต่างระหว่างค่าที่สังเกตได้กับค่าที่คาดหวังหารด้วยค่าที่คาดหวัง
ดังนั้น สูตรของการทดสอบไคสแควร์ คือ:

ทอง:
-

คือสถิติการทดสอบไคสแควร์ ซึ่งตามหลังการแจกแจงไคสแควร์ด้วย

ระดับความอิสระ.
-

คือขนาดตัวอย่างข้อมูล
-

คือค่าที่สังเกตได้ของข้อมูล i
-

คือค่าที่คาดหวังสำหรับข้อมูล i
สมมติฐานว่างของสมมติฐานที่ทดสอบการทดสอบไคสแควร์คือค่าที่สังเกตได้นั้นเทียบเท่ากับค่าที่คาดหวัง ในทางกลับกัน สมมติฐานทางเลือกของการทดสอบคือค่าที่สังเกตค่าใดค่าหนึ่งแตกต่างจากค่าที่คาดไว้
![Rendered by QuickLaTeX.com \begin{cases}H_0:O_i=E_i \quad \forall i\\[2ex]H_1:\exists \ O_i\neq E_i \end{cases}](https://statorials.org/wp-content/ql-cache/quicklatex.com-3ef850ed6bba6d33fed54194e3e675e4_l3.png)
จึงถือว่ามีนัยสำคัญในระดับหนึ่ง
![]()
ควรเปรียบเทียบสถิติการทดสอบที่คำนวณได้กับค่าการทดสอบวิกฤตเพื่อพิจารณาว่าจะปฏิเสธสมมติฐานว่างหรือสมมติฐานทางเลือก:
- หากสถิติการทดสอบน้อยกว่าค่าวิกฤต

สมมติฐานทางเลือกถูกปฏิเสธ (และยอมรับสมมติฐานว่าง)
- หากสถิติการทดสอบมากกว่าค่าวิกฤต

สมมติฐานว่างถูกปฏิเสธ (และยอมรับสมมติฐานทางเลือก)
ตัวอย่างการทดสอบไคสแควร์
เมื่อเราได้เห็นคำจำกัดความของการทดสอบไคสแควร์แล้วและสูตรของมันคืออะไร เราจะแสดงตัวอย่างการแก้ปัญหาทีละขั้นตอนด้านล่างเพื่อให้คุณเห็นว่าการทดสอบทางสถิติประเภทนี้ดำเนินการอย่างไร
- เจ้าของร้านค้ากล่าวว่า 50% ของยอดขายของเขาสำหรับผลิตภัณฑ์ A, 35% ของยอดขายของเขาสำหรับผลิตภัณฑ์ B และ 15% ของยอดขายของเขาสำหรับผลิตภัณฑ์ C อย่างไรก็ตาม หน่วยที่ขายของผลิตภัณฑ์แต่ละรายการคือหน่วยที่แสดงไว้ ใน ตารางฉุกเฉิน ต่อไปนี้ วิเคราะห์ว่าข้อมูลทางทฤษฎีของเจ้าของมีความแตกต่างทางสถิติจากข้อมูลจริงที่รวบรวมหรือไม่
| ผลิตภัณฑ์ | ยอดขายที่สังเกตได้ (O i ) |
|---|---|
| สินค้า ก | 453 |
| สินค้าบี | 268 |
| สินค้า ค | 79 |
| ทั้งหมด | 800 |
ขั้นแรกเราต้องคำนวณค่าที่เจ้าของร้านคาดหวัง ในการดำเนินการนี้ เราจะคูณเปอร์เซ็นต์ของยอดขายที่คาดหวังของแต่ละผลิตภัณฑ์ด้วยจำนวนยอดขายทั้งหมดที่ทำได้:
![Rendered by QuickLaTeX.com \begin{array}{c}E_A=800\cdot 0,5=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-cfd0d5e1cc7a049ddd825c5db9eb4bec_l3.png)
ดังนั้น ตารางการกระจายความถี่ ของปัญหาจึงเป็นดังนี้
| ผลิตภัณฑ์ | ยอดขายที่สังเกตได้ (O i ) | ยอดขายที่คาดหวัง (E i ) |
|---|---|---|
| สินค้า ก | 453 | 400 |
| สินค้าบี | 268 | 280 |
| สินค้า ค | 79 | 120 |
| ทั้งหมด | 800 | 800 |
ตอนนี้เราได้คำนวณค่าทั้งหมดแล้ว เราใช้สูตรการทดสอบไคสแควร์เพื่อคำนวณสถิติการทดสอบ:
![Rendered by QuickLaTeX.com \begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-8c76621fbe8504217dfe8ac55b2d6e67_l3.png)
เมื่อคำนวณค่าของสถิติการทดสอบแล้ว เราจะใช้ตารางการแจกแจงไคสแควร์เพื่อค้นหาค่าวิกฤตของการทดสอบ การกระจายไคสแควร์มี
![]()
ระดับความเป็นอิสระ ดังนั้น หากเราเลือกระดับความสำคัญ
![]()
ค่าวิกฤติของการทดสอบมีดังนี้:
![Rendered by QuickLaTeX.com \begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-1850e764fc71b1e7b49b0c4d8133ab89_l3.png)
ดังนั้นสถิติการทดสอบ (21.53) มากกว่าค่าการทดสอบวิกฤต (5.991) ดังนั้นสมมติฐานว่างจึงถูกปฏิเสธและยอมรับสมมติฐานทางเลือก ซึ่งหมายความว่าข้อมูลแตกต่างกันมาก ดังนั้นเจ้าของร้านค้าจึงคาดหวังยอดขายที่แตกต่างจากที่เกิดขึ้นจริง
การตีความการทดสอบไคสแควร์
การตีความการทดสอบไคสแควร์ ไม่สามารถทำได้เพียงผลการทดสอบที่ได้รับ แต่ต้องเปรียบเทียบกับค่าวิกฤตของการทดสอบ
ตามตรรกะ ยิ่งค่าของสถิติการทดสอบที่คำนวณได้น้อยลง ข้อมูลที่สังเกตได้ก็จะคล้ายกับข้อมูลที่คาดไว้มากขึ้นเท่านั้น ดังนั้นหากผลการทดสอบไคสแควร์เป็น 0 แสดงว่าค่าที่สังเกตได้และค่าที่คาดหวังนั้นเหมือนกันทุกประการ ในทางกลับกัน ยิ่งผลการทดสอบมากก็หมายความว่ายิ่งค่าที่สังเกตได้แตกต่างไปจากค่าที่คาดไว้มากเท่านั้น
อย่างไรก็ตาม ในการตัดสินใจว่าชุดข้อมูลทั้งสองชุดมีความแตกต่างกันทางสถิติหรือเท่ากัน เราจะต้องเปรียบเทียบค่าการทดสอบที่คำนวณได้กับค่าการทดสอบวิกฤต เพื่อที่จะปฏิเสธสมมติฐานว่างหรือสมมติฐานทางเลือกของความแตกต่าง หากสถิติการทดสอบน้อยกว่าค่าวิกฤตของการแจกแจง สมมติฐานทางเลือกจะถูกปฏิเสธ ในทางกลับกัน หากสถิติการทดสอบมากกว่าค่าวิกฤตของการแจกแจง สมมติฐานว่างจะถูกปฏิเสธ