เงื่อนไขผ่าน/ไม่ผ่านในสถิติคืออะไร?
การทดลองแบบเบอร์นูลลี เป็นการทดลองที่มีผลลัพธ์ที่เป็นไปได้เพียงสองผลลัพธ์เท่านั้น ได้แก่ “ความสำเร็จ” หรือ “ความล้มเหลว” และความน่าจะเป็นที่จะประสบความสำเร็จจะเท่ากันทุกครั้งที่ทำการทดลอง
ตัวอย่างของเรียงความของ Bernoulli คือการโยนเหรียญ เหรียญสามารถลงได้สองหัวเท่านั้น (เราอาจเรียกหัวว่า “ตี” และก้อยว่า “ล้มเหลว”) และความน่าจะเป็นที่จะสำเร็จในการพลิกแต่ละครั้งคือ 0.5 โดยถือว่าเหรียญนั้นยุติธรรม
บ่อยครั้งในสถิติ เมื่อเราต้องการคำนวณความน่าจะเป็นที่เกี่ยวข้องกับการทดลองเบอร์นูลลีมากกว่า 2-3 ครั้ง เราจะใช้ การแจกแจงแบบปกติ เป็นการประมาณ อย่างไรก็ตาม ในการดำเนินการนี้ เราจำเป็นต้องตรวจสอบว่าตรงตาม เงื่อนไขผ่าน/ไม่ผ่าน :
เงื่อนไขผ่าน/ไม่ผ่าน: จะต้องมีความสำเร็จที่คาดหวังอย่างน้อย 10 รายการและความล้มเหลวที่คาดหวัง 10 รายการในตัวอย่างเพื่อใช้การแจกแจงแบบปกติเป็นการประมาณ
เขียนเป็นสัญกรณ์เราต้องตรวจสอบสองสิ่งต่อไปนี้:
- จำนวนความสำเร็จที่คาดหวังคืออย่างน้อย 10: np ≥ 10
- จำนวนความล้มเหลวที่คาดหวังคืออย่างน้อย 10: n(1-p) ≥ 10
โดยที่ n คือขนาดของกลุ่มตัวอย่าง และ p คือความน่าจะเป็นที่จะประสบความสำเร็จสำหรับการทดลองที่กำหนด
หมายเหตุ: คู่มือบางเล่มบอกว่าต้องใช้การประมาณความสำเร็จที่คาดหวังเพียง 5 รายการและความล้มเหลวที่คาดหวัง 5 รายการเท่านั้นจึงจะใช้การประมาณปกติได้ อย่างไรก็ตาม 10 มักใช้มากกว่าและเป็นตัวเลขที่อนุรักษ์นิยมมากกว่า ดังนั้นเราจะใช้หมายเลขนี้ในบทช่วยสอนนี้
ตัวอย่าง: การตรวจสอบเงื่อนไขผ่าน/ไม่ผ่าน
สมมติว่าเราต้องการสร้างช่วงความเชื่อมั่นสำหรับสัดส่วนของผู้อยู่อาศัยในเขตหนึ่งที่สนับสนุนกฎหมายบางข้อ เราสุ่มตัวอย่างผู้อยู่อาศัย 100 คน และถามพวกเขาว่าจุดยืนของพวกเขาในด้านกฎหมายคืออะไร นี่คือผลลัพธ์:
- ขนาดตัวอย่าง n = 100
- สัดส่วนสนับสนุนกฎหมาย p = 0.56
เราต้องการใช้สูตรต่อไปนี้เพื่อคำนวณช่วงความเชื่อมั่น:
ช่วงความเชื่อมั่น = p +/- z*√ p(1-p) / n
ทอง:
- p: สัดส่วนตัวอย่าง
- z: ค่า z ซึ่งสอดคล้องกับการแจกแจงแบบปกติ
- n: ขนาดตัวอย่าง
สูตรนี้ใช้ค่า az จากการแจกแจงแบบปกติ ในสูตรนี้ เราใช้การกระจายตัวแบบปกติเพื่อประมาณการกระจายตัวแบบทวินาม
อย่างไรก็ตาม ในการดำเนินการนี้ เราจำเป็นต้องตรวจสอบว่าเป็นไปตาม เงื่อนไขผ่าน/ไม่ผ่าน ตรวจสอบว่าจำนวนความสำเร็จและจำนวนความล้มเหลวในกลุ่มตัวอย่างมีค่าอย่างน้อย 10:
จำนวนความสำเร็จ: np = 100*.56 = 56
จำนวนความล้มเหลว: n(1-p) = 100*(1-.56) = 44
ตัวเลขทั้งสองมีค่าเท่ากับหรือมากกว่า 10 ดังนั้นเราจึงสามารถใช้สูตรด้านบนเพื่อคำนวณช่วงความเชื่อมั่นได้
แหล่งข้อมูลเพิ่มเติม
เงื่อนไขอีกประการหนึ่งที่ต้องปฏิบัติตามเพื่อใช้การแจกแจงแบบปกติเป็นการประมาณค่าการแจกแจงทวินามก็คือ ขนาดตัวอย่างที่เรากำลังดำเนินการต้องไม่เกิน 10% ของขนาดประชากร สิ่งนี้เรียกว่าเงื่อนไข 10%
นอกจากนี้ โปรดทราบว่าหากคุณกำลังทำงานด้วยสองสัดส่วน (เช่น การสร้างช่วงความมั่นใจสำหรับความแตกต่างระหว่างสัดส่วน ) คุณต้องตรวจสอบว่าจำนวนความสำเร็จและความล้มเหลวที่คาดหวังใน สอง ตัวอย่างคืออย่างน้อย 10