การทดสอบไคสแควร์

บทความนี้จะอธิบายว่าการทดสอบไคสแควร์ในสถิติคืออะไร และใช้เพื่ออะไร นอกจากนี้คุณยังจะได้ค้นพบวิธีทำแบบทดสอบไคสแควร์และแบบฝึกหัดที่แก้ไขทีละขั้นตอน

การทดสอบไคสแควร์คืออะไร?

การทดสอบไคสแควร์ เป็นการทดสอบทางสถิติที่ใช้ในการพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างความถี่ที่คาดหวังกับความถี่ที่สังเกตได้หรือไม่

ตามหลักเหตุผลแล้ว สถิติการทดสอบไคสแควร์เป็นไปตาม การแจกแจงไคสแควร์ ดังนั้นค่าของสถิติการทดสอบจึงต้องเปรียบเทียบกับค่าเฉพาะของการแจกแจงไคสแควร์ ด้านล่างนี้เราจะดูว่าการทดสอบไคสแควร์ดำเนินการอย่างไร

การทดสอบทางสถิติประเภทนี้เรียกอีกอย่างว่า การทดสอบไคสแควร์ของเพียร์สัน และบางครั้งแสดงด้วยสัญลักษณ์ของการแจกแจงไคสแควร์: χ² test

สูตรทดสอบไคสแควร์

สถิติการทดสอบไคสแควร์เท่ากับผลรวมของกำลังสองของความแตกต่างระหว่างค่าที่สังเกตได้กับค่าที่คาดหวังหารด้วยค่าที่คาดหวัง

ดังนั้น สูตรของการทดสอบไคสแควร์ คือ:

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

ทอง:

  • \chi^2

    คือสถิติการทดสอบไคสแควร์ ซึ่งตามหลังการแจกแจงไคสแควร์ด้วย

    k-1

    ระดับความอิสระ.

  • k

    คือขนาดตัวอย่างข้อมูล

  • O_i

    คือค่าที่สังเกตได้ของข้อมูล i

  • E_i

    คือค่าที่คาดหวังสำหรับข้อมูล i

สมมติฐานว่างของสมมติฐานที่ทดสอบการทดสอบไคสแควร์คือค่าที่สังเกตได้นั้นเทียบเท่ากับค่าที่คาดหวัง ในทางกลับกัน สมมติฐานทางเลือกของการทดสอบคือค่าที่สังเกตค่าใดค่าหนึ่งแตกต่างจากค่าที่คาดไว้

\begin{cases}H_0:O_i=E_i \quad \forall i\\[2ex]H_1:\exists \ O_i\neq E_i \end{cases}

จึงถือว่ามีนัยสำคัญในระดับหนึ่ง

\alpha

ควรเปรียบเทียบสถิติการทดสอบที่คำนวณได้กับค่าการทดสอบวิกฤตเพื่อพิจารณาว่าจะปฏิเสธสมมติฐานว่างหรือสมมติฐานทางเลือก:

  • หากสถิติการทดสอบน้อยกว่าค่าวิกฤต

    \chi_{1-\alpha|k-1}^2

    สมมติฐานทางเลือกถูกปฏิเสธ (และยอมรับสมมติฐานว่าง)

  • หากสถิติการทดสอบมากกว่าค่าวิกฤต

    \chi_{1-\alpha|k-1}^2

    สมมติฐานว่างถูกปฏิเสธ (และยอมรับสมมติฐานทางเลือก)

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}” title=”Rendered by QuickLaTeX.com” height=”70″ width=”243″ style=”vertical-align: 0px;”></p>
</p>
<h2 class= ตัวอย่างการทดสอบไคสแควร์

เมื่อเราได้เห็นคำจำกัดความของการทดสอบไคสแควร์แล้วและสูตรของมันคืออะไร เราจะแสดงตัวอย่างการแก้ปัญหาทีละขั้นตอนด้านล่างเพื่อให้คุณเห็นว่าการทดสอบทางสถิติประเภทนี้ดำเนินการอย่างไร

  • เจ้าของร้านค้ากล่าวว่า 50% ของยอดขายของเขาสำหรับผลิตภัณฑ์ A, 35% ของยอดขายของเขาสำหรับผลิตภัณฑ์ B และ 15% ของยอดขายของเขาสำหรับผลิตภัณฑ์ C อย่างไรก็ตาม หน่วยที่ขายของผลิตภัณฑ์แต่ละรายการคือหน่วยที่แสดงไว้ ใน ตารางฉุกเฉิน ต่อไปนี้ วิเคราะห์ว่าข้อมูลทางทฤษฎีของเจ้าของมีความแตกต่างทางสถิติจากข้อมูลจริงที่รวบรวมหรือไม่
ผลิตภัณฑ์ ยอดขายที่สังเกตได้ (O i )
สินค้า ก 453
สินค้าบี 268
สินค้า ค 79
ทั้งหมด 800

ขั้นแรกเราต้องคำนวณค่าที่เจ้าของร้านคาดหวัง ในการดำเนินการนี้ เราจะคูณเปอร์เซ็นต์ของยอดขายที่คาดหวังของแต่ละผลิตภัณฑ์ด้วยจำนวนยอดขายทั้งหมดที่ทำได้:

\begin{array}{c}E_A=800\cdot 0,5=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

ดังนั้น ตารางการกระจายความถี่ ของปัญหาจึงเป็นดังนี้

ผลิตภัณฑ์ ยอดขายที่สังเกตได้ (O i ) ยอดขายที่คาดหวัง (E i )
สินค้า ก 453 400
สินค้าบี 268 280
สินค้า ค 79 120
ทั้งหมด 800 800

ตอนนี้เราได้คำนวณค่าทั้งหมดแล้ว เราใช้สูตรการทดสอบไคสแควร์เพื่อคำนวณสถิติการทดสอบ:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

เมื่อคำนวณค่าของสถิติการทดสอบแล้ว เราจะใช้ตารางการแจกแจงไคสแควร์เพื่อค้นหาค่าวิกฤตของการทดสอบ การกระจายไคสแควร์มี

k-1=3-1=2

ระดับความเป็นอิสระ ดังนั้น หากเราเลือกระดับความสำคัญ

\alpha=0,05

ค่าวิกฤติของการทดสอบมีดังนี้:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

ดังนั้นสถิติการทดสอบ (21.53) มากกว่าค่าการทดสอบวิกฤต (5.991) ดังนั้นสมมติฐานว่างจึงถูกปฏิเสธและยอมรับสมมติฐานทางเลือก ซึ่งหมายความว่าข้อมูลแตกต่างกันมาก ดังนั้นเจ้าของร้านค้าจึงคาดหวังยอดขายที่แตกต่างจากที่เกิดขึ้นจริง

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=”Rendered by QuickLaTeX.com” height=”17″ width=”354″ style=”vertical-align: -4px;”></p>
</p>
<h2 class= การตีความการทดสอบไคสแควร์

การตีความการทดสอบไคสแควร์ ไม่สามารถทำได้เพียงผลการทดสอบที่ได้รับ แต่ต้องเปรียบเทียบกับค่าวิกฤตของการทดสอบ

ตามตรรกะ ยิ่งค่าของสถิติการทดสอบที่คำนวณได้น้อยลง ข้อมูลที่สังเกตได้ก็จะคล้ายกับข้อมูลที่คาดไว้มากขึ้นเท่านั้น ดังนั้นหากผลการทดสอบไคสแควร์เป็น 0 แสดงว่าค่าที่สังเกตได้และค่าที่คาดหวังนั้นเหมือนกันทุกประการ ในทางกลับกัน ยิ่งผลการทดสอบมากก็หมายความว่ายิ่งค่าที่สังเกตได้แตกต่างไปจากค่าที่คาดไว้มากเท่านั้น

อย่างไรก็ตาม ในการตัดสินใจว่าชุดข้อมูลทั้งสองชุดมีความแตกต่างกันทางสถิติหรือเท่ากัน เราจะต้องเปรียบเทียบค่าการทดสอบที่คำนวณได้กับค่าการทดสอบวิกฤต เพื่อที่จะปฏิเสธสมมติฐานว่างหรือสมมติฐานทางเลือกของความแตกต่าง หากสถิติการทดสอบน้อยกว่าค่าวิกฤตของการแจกแจง สมมติฐานทางเลือกจะถูกปฏิเสธ ในทางกลับกัน หากสถิติการทดสอบมากกว่าค่าวิกฤตของการแจกแจง สมมติฐานว่างจะถูกปฏิเสธ

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *