เงื่อนไขของกลุ่มตัวอย่างขนาดใหญ่: คำจำกัดความและตัวอย่าง
ในทางสถิติ เรามักจะต้องการใช้ ตัวอย่าง เพื่อสรุปเกี่ยวกับประชากรผ่าน การทดสอบสมมติฐาน หรือ ช่วงความเชื่อมั่น
สูตรส่วนใหญ่ที่เราใช้ในการทดสอบสมมติฐานและช่วงความเชื่อมั่นถือว่าตัวอย่างที่ให้มาเป็นไปตาม การแจกแจงแบบปกติ โดยประมาณ
อย่างไรก็ตาม เพื่อที่จะกำหนดสมมติฐานนี้ได้อย่างปลอดภัย เราต้องแน่ใจว่าขนาดของกลุ่มตัวอย่างของเราใหญ่เพียงพอ โดยเฉพาะอย่างยิ่ง เราต้องแน่ใจว่าเป็นไปตาม เงื่อนไขของตัวอย่างจำนวนมาก
เงื่อนไขตัวอย่างขนาดใหญ่: ขนาดตัวอย่างอย่างน้อย 30
หมายเหตุ: ในหนังสือเรียนบางเล่ม ขนาดตัวอย่างที่ “ใหญ่เพียงพอ” กำหนดไว้ที่อย่างน้อย 40 แต่มักใช้จำนวน 30 มากกว่า
เมื่อตรงตามเงื่อนไขนี้ ก็สามารถสันนิษฐานได้ว่า การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่าง มีค่าประมาณปกติ ข้อสันนิษฐานนี้ช่วยให้เราสามารถใช้ตัวอย่างเพื่อสรุปเกี่ยวกับประชากรที่สุ่มตัวอย่างมาได้
เหตุผลที่ใช้เลข 30 นั้นขึ้นอยู่กับทฤษฎีบทขีดจำกัดจุดศูนย์กลาง คุณสามารถอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้ได้ใน โพสต์บล็อก นี้
ตัวอย่าง: การตรวจสอบสถานะของตัวอย่างขนาดใหญ่
สมมติว่าเครื่องจักรบางเครื่องสร้างแครกเกอร์ การกระจายน้ำหนักของคุกกี้เหล่านี้จะเอียงไปทางขวาโดยมีค่าเฉลี่ย 10 ออนซ์ และส่วนเบี่ยงเบนมาตรฐาน 2 ออนซ์ หากเราสุ่มตัวอย่างคุกกี้ง่ายๆ จำนวน 100 ชิ้นที่ผลิตโดยเครื่องนี้ ความน่าจะเป็นที่น้ำหนักเฉลี่ยของคุกกี้ในตัวอย่างนี้น้อยกว่า 9.8 ออนซ์ เป็นเท่าใด
เพื่อตอบคำถามนี้ เราสามารถใช้ เครื่องคิดเลข CDF ปกติได้ แต่ก่อนอื่น เราต้องตรวจสอบว่าขนาดของกลุ่มตัวอย่างใหญ่พอที่จะถือว่าการกระจายตัวของค่าเฉลี่ยตัวอย่างเป็นปกติ
ในตัวอย่างนี้ ขนาดตัวอย่างของเราคือ n = 100 ซึ่งมากกว่า 30 มาก แม้ว่าการกระจายน้ำหนักคุกกี้ที่แท้จริงจะเอียงไปทางขวา เนื่องจากขนาดตัวอย่างของเรา “ใหญ่พอ” เราจึงสามารถสรุปได้ว่าการกระจาย ของค่าเฉลี่ยตัวอย่างเป็นค่าปกติ ดังนั้นเราจึงสามารถใช้เครื่องคิดเลข CDF ปกติเพื่อแก้ปัญหานี้ได้อย่างปลอดภัย
การเปลี่ยนแปลงสภาพของกลุ่มตัวอย่างขนาดใหญ่
บ่อยครั้งที่ขนาดตัวอย่างจะถือว่า “ใหญ่เพียงพอ” หากมากกว่าหรือเท่ากับ 30 แต่จำนวนนี้อาจแตกต่างเล็กน้อยขึ้นอยู่กับรูปร่างพื้นฐานของการกระจายตัวของประชากร
โดยเฉพาะ:
- หากการกระจายตัวของประชากรเป็นแบบสมมาตร ขนาดของกลุ่มตัวอย่างที่เล็กเพียง 15 คนก็เพียงพอแล้วในบางครั้ง
- หากการกระจายตัวของประชากรบิดเบือน โดยปกติจะต้องมีกลุ่มตัวอย่างอย่างน้อย 30 คน
- หากการกระจายตัวของประชากรบิดเบือนอย่างมาก อาจจำเป็นต้องมีกลุ่มตัวอย่างตั้งแต่ 40 คนขึ้นไป
ขึ้นอยู่กับรูปร่างของการกระจายตัวของประชากร คุณอาจต้องมีขนาดตัวอย่างมากกว่าหรือน้อยกว่า 30 จึงจะใช้ทฤษฎีบทขีดจำกัดกลางได้
แหล่งข้อมูลเพิ่มเติม
ความรู้เบื้องต้นเกี่ยวกับทฤษฎีบทขีดจำกัดจุดศูนย์กลาง
ความรู้เบื้องต้นเกี่ยวกับการแจกแจงตัวอย่าง