เงื่อนไข 10% ในสถิติ: คำจำกัดความและตัวอย่าง
การทดลองแบบเบอร์นูลลี เป็นการทดลองที่มีผลลัพธ์ที่เป็นไปได้เพียงสองผลลัพธ์เท่านั้น ได้แก่ “ความสำเร็จ” หรือ “ความล้มเหลว” และความน่าจะเป็นที่จะประสบความสำเร็จจะเท่ากันทุกครั้งที่ทำการทดลอง
ตัวอย่างของเรียงความของ Bernoulli คือการโยนเหรียญ เหรียญสามารถลงได้สองหัวเท่านั้น (เราอาจเรียกหัวว่า “ตี” และก้อยว่า “ล้มเหลว”) และความน่าจะเป็นที่จะสำเร็จในการพลิกแต่ละครั้งคือ 0.5 โดยถือว่าเหรียญนั้นยุติธรรม
บ่อยครั้งในสถิติ เมื่อเราต้องการคำนวณความน่าจะเป็นที่เกี่ยวข้องกับการทดลองเบอร์นูลลีมากกว่า 2-3 ครั้ง เราจะใช้ การแจกแจงแบบปกติ เป็นการประมาณ อย่างไรก็ตาม ในการดำเนินการนี้ เราต้องถือว่าการทดลองเป็นอิสระจากกัน
ในกรณีที่การทดลอง ไม่ ได้เป็นอิสระอย่างแท้จริง เราสามารถสันนิษฐานได้เสมอว่าเป็นเช่นนั้นหากขนาดตัวอย่างที่เราดำเนินการอยู่ไม่เกิน 10% ของขนาดประชากร สิ่งนี้เรียกว่า เงื่อนไข 10%
เงื่อนไข 10%: ตราบใดที่ขนาดตัวอย่างน้อยกว่าหรือเท่ากับ 10% ของขนาดประชากร เราสามารถสรุปได้ว่าการทดสอบแบบแบร์นูลลีเป็นอิสระจากกัน
สัญชาตญาณเบื้องหลังสภาพ 10%
เพื่อพัฒนาสัญชาตญาณเบื้องหลังเงื่อนไข 10% ให้พิจารณาตัวอย่างต่อไปนี้
สมมติว่า สัดส่วนที่แท้จริงของนักเรียนในบางชั้นเรียนที่ชอบฟุตบอลมากกว่าบาสเก็ตบอลคือ 50% ให้ ตัวแปรสุ่ม X คือจำนวนนักเรียนที่ถูกสุ่มเลือกใน 4 การทดลองที่ชอบฟุตบอลมากกว่าบาสเก็ตบอล สมมติว่าเราต้องการเข้าใจความน่าจะเป็นที่นักเรียนที่ได้รับการสุ่มเลือกทั้ง 4 คนชอบฟุตบอลมากกว่าบาสเก็ตบอล
หากขนาดชั้นเรียนของเรามีนักเรียน 20 คนและการทดลองของเราเป็นอิสระต่อกัน (เช่น เราสามารถสุ่มตัวอย่างซ้ำของนักเรียนทั้งหมด 20 คน) ความน่าจะเป็นที่นักเรียนแต่ละคนชอบฟุตบอลมากกว่าบาสเก็ตบอลสามารถคำนวณได้ดังนี้:
P(นักเรียนทั้ง 4 คน ชอบฟุตบอล) = 10/20 * 10/20 * 10/20 * 10/20 = .0625
อย่างไรก็ตาม หากการทดลองของเรา ไม่ เป็นอิสระต่อกัน (เช่น เมื่อเราสุ่มตัวอย่างนักเรียนแล้ว จะไม่สามารถส่งกลับเข้าชั้นเรียนได้) ความน่าจะเป็นที่นักเรียนทั้ง 4 คนจะชอบฟุตบอลจะถูกคำนวณดังนี้:
P(นักเรียนทั้ง 4 คน ชอบฟุตบอล) = 10/20 * 9/19 * 8/18 * 7/17 = .0433
ความน่าจะเป็นทั้งสองนี้แตกต่างกันมาก พิจารณาว่าในตัวอย่างนี้ ขนาดกลุ่มตัวอย่างของเรา (นักเรียน 4 คน) ไม่น้อยกว่าหรือเท่ากับ 10% ของประชากร (นักเรียน 20 คน) ดังนั้น เราจะไม่สามารถใช้เงื่อนไข 10% ได้
อย่างไรก็ตาม ให้พิจารณาตารางต่อไปนี้ซึ่งแสดงความน่าจะเป็นที่นักเรียนที่ได้รับการสุ่มเลือกทั้ง 4 คนจะชอบฟุตบอล โดยพิจารณาจากขนาดชั้นเรียน:
เมื่อขนาดกลุ่มตัวอย่างสัมพันธ์กับขนาดประชากร (เช่น “ขนาดชั้นเรียน” ในตัวอย่างนี้) ลดลง ความน่าจะเป็นที่คำนวณได้ระหว่างการทดลองอิสระและการทดลองที่ไม่เป็นอิสระก็ใกล้เข้ามามากขึ้นเรื่อยๆ
โปรดทราบว่าเมื่อขนาดกลุ่มตัวอย่างเท่ากับ 10% ของขนาดประชากรพอดี ความแตกต่างระหว่างความน่าจะเป็นของการทดลองอิสระและการทดลองที่ไม่เป็นอิสระจะค่อนข้างใกล้เคียงกัน
และเมื่อขนาดกลุ่มตัวอย่างน้อยกว่า 10% ของขนาดประชากรอย่างมาก (เช่น เพียง 0.4% ของขนาดประชากรในแถวสุดท้ายของตาราง) ความน่าจะเป็นระหว่างการทดลองอิสระกับการทดลองที่ไม่เป็นอิสระจะใกล้เคียงกันมาก
บทสรุป
เงื่อนไข 10% ระบุว่าขนาดตัวอย่างของเราต้องน้อยกว่าหรือเท่ากับ 10% ของขนาดประชากร เพื่อที่จะสรุปได้อย่างปลอดภัยว่าชุดการทดลอง Bernoulli หนึ่งชุดเป็นอิสระจากกัน
แน่นอนว่า เป็นการดีที่สุดที่ขนาดตัวอย่างของเราจะต้องต่ำกว่า 10% ของขนาดประชากร เพื่อให้การอนุมานเกี่ยวกับประชากรมีความแม่นยำที่สุดเท่าที่จะเป็นไปได้ ตัวอย่างเช่น เราต้องการให้ขนาดกลุ่มตัวอย่างของเราเป็นเพียง 5% ของประชากร แทนที่จะเป็น 10%
แหล่งข้อมูลเพิ่มเติม
ความรู้เบื้องต้นเกี่ยวกับการแจกแจงแบบปกติ
ความรู้เบื้องต้นเกี่ยวกับการแจกแจงแบบทวินาม
ความรู้เบื้องต้นเกี่ยวกับทฤษฎีบทขีดจำกัดศูนย์กลาง