ทฤษฎีบทขีดจำกัดกลาง: คำจำกัดความ + ตัวอย่าง
ทฤษฎีบทขีดจำกัดกลาง ระบุว่า การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่าง จะอยู่ที่ประมาณปกติ หากขนาดตัวอย่างมีขนาดใหญ่เพียงพอ แม้ว่าการกระจายตัวของประชากรจะไม่ปกติก็ตาม
ทฤษฎีบทขีดจำกัดกลางยังระบุด้วยว่าการกระจายตัวอย่างจะมีคุณสมบัติดังต่อไปนี้:
1. ค่าเฉลี่ยของการกระจายตัวอย่างจะเท่ากับค่าเฉลี่ยของการกระจายตัวของประชากร:
x = ไมโคร
2. ความแปรปรวนของการกระจายตัวอย่างจะเท่ากับความแปรปรวนของการกระจายตัวของประชากรหารด้วยขนาดตัวอย่าง:
s2 = σ2 /n
ตัวอย่างของทฤษฎีบทขีดจำกัดกลาง
ต่อไปนี้คือตัวอย่างบางส่วนที่แสดงให้เห็นทฤษฎีบทขีดจำกัดกลางในทางปฏิบัติ
กระจายสม่ำเสมอ
สมมติว่าความกว้างของกระดองเต่ามีการกระจายสม่ำเสมอ โดยมีความกว้างขั้นต่ำ 2 นิ้ว และความกว้างสูงสุด 6 นิ้ว นั่นคือถ้าเราเลือกเต่าโดยการสุ่มและวัดความกว้างของกระดอง มันก็มีแนวโน้มที่จะมี ความกว้าง ระหว่าง 2 ถึง 6 นิ้วด้วย.
หากเราสร้างฮิสโตแกรมเพื่อแสดงการกระจายความกว้างของกระดองเต่า มันจะมีลักษณะดังนี้:
ค่าเฉลี่ยของการแจกแจงแบบสม่ำเสมอคือ μ = (b+a) / 2 โดยที่ b คือค่าที่ใหญ่ที่สุดที่เป็นไปได้ และ a คือค่าที่น้อยที่สุดที่เป็นไปได้ ในกรณีนี้คือ (6+2) / 2 = 4
ความแปรปรวนของการแจกแจงแบบสม่ำเสมอคือ σ2 = (ba) 2/12 ในกรณีนี้คือ (6-2) 2/12 = 1.33
สุ่มตัวอย่าง 2 ตัวอย่างจากการแจกแจงแบบสม่ำเสมอ
ลองจินตนาการว่าเราสุ่มตัวอย่างเต่า 2 ตัวจากประชากรกลุ่มนี้ และวัดความกว้างของกระดองเต่าแต่ละตัว สมมติว่ากระดองของเต่าตัวแรกกว้าง 3 นิ้ว และเต่าตัวที่สองกว้าง 6 นิ้ว ความกว้างเฉลี่ยของตัวอย่างเต่า 2 ตัวนี้คือ 4.5 นิ้ว
ต่อไป ลองจินตนาการว่าเราสุ่มตัวอย่างเต่า 2 ตัวจากประชากรกลุ่มนี้ แล้ววัดความกว้างของกระดองของเต่าแต่ละตัวอีกครั้ง สมมติว่ากระดองของเต่าตัวแรกกว้าง 2.5 นิ้ว และเต่าตัวที่สองก็กว้าง 2.5 นิ้วเช่นกัน ความกว้างเฉลี่ยของตัวอย่างเต่า 2 ตัวนี้คือ 2.5 นิ้ว
ลองนึกภาพเราสุ่มเก็บตัวอย่างเต่า 2 ตัวซ้ำแล้วซ้ำเล่า และค้นหาความกว้างของกระดองโดยเฉลี่ยในแต่ละครั้ง
หากเราสร้างฮิสโตแกรมเพื่อแสดงความกว้างเปลือกเฉลี่ยของตัวอย่างทั้งหมดนี้จากเต่า 2 ตัว มันจะมีลักษณะดังนี้:
สิ่งนี้เรียกว่า การกระจายตัวอย่างสำหรับค่าเฉลี่ยตัวอย่าง เนื่องจากเป็นการแสดงการกระจายตัวของค่าเฉลี่ยตัวอย่าง
ค่าเฉลี่ยของการกระจายตัวอย่างนี้คือ x = μ = 4
ความแปรปรวนของการแจกแจงตัวอย่างนี้คือ s2 = σ2 / n = 1.33 / 2 = 0.665
สุ่มตัวอย่างจำนวน 5 ตัวอย่างจากการแจกแจงแบบสม่ำเสมอ
ทีนี้ลองนึกภาพเราทำการทดลองเดิมซ้ำ แต่คราวนี้เราสุ่มตัวอย่างจากเต่า 5 ตัวครั้งแล้วครั้งเล่า และค้นหาความกว้างของกระดองเฉลี่ยในแต่ละครั้ง
หากเราสร้างฮิสโตแกรมเพื่อแสดงความกว้างเปลือกหอยเฉลี่ยของตัวอย่างเต่า 5 ตัวทั้งหมดนี้ มันจะมีลักษณะดังนี้:
โปรดสังเกตว่าการแจกแจงนี้มีรูปร่าง “ระฆัง” มากกว่าซึ่งคล้ายกับ การแจกแจงแบบปกติ เนื่องจากเมื่อเราเลือกตัวอย่างที่ 5 ค่าความแปรปรวนระหว่างค่าเฉลี่ยตัวอย่างจะต่ำกว่ามาก ดังนั้นเราจึงมีโอกาสน้อยที่จะได้ตัวอย่างที่มีค่าเฉลี่ยใกล้เคียง 2 นิ้วหรือ 6 นิ้ว และมีแนวโน้มที่จะได้ตัวอย่างที่มีค่าเฉลี่ยใกล้เคียง 2 นิ้วหรือ 6 นิ้ว. ค่าเฉลี่ยจะใกล้เคียงกับค่าเฉลี่ยประชากรจริงประมาณ 4 นิ้ว
ค่าเฉลี่ยของการกระจายตัวอย่างนี้คือ x = μ = 4
ความแปรปรวนของการแจกแจงตัวอย่างนี้คือ s2 = σ2 / n = 1.33 / 5 = 0.266
สุ่มตัวอย่างจำนวน 30 ตัวอย่างจากการแจกแจงแบบสม่ำเสมอ
ทีนี้ลองนึกภาพเราทำการทดลองเดิมซ้ำ แต่คราวนี้เราสุ่มตัวอย่างจากเต่า 30 ตัวซ้ำแล้วซ้ำเล่า และค้นหาความกว้างของกระดองเฉลี่ยในแต่ละครั้ง
หากเราสร้างฮิสโตแกรมเพื่อแสดงความกว้างเปลือกหอยเฉลี่ยของตัวอย่างเต่า 30 ตัวทั้งหมด จะมีลักษณะดังนี้:
โปรดสังเกตว่าการกระจายตัวอย่างนี้จะมีรูปทรงระฆังมากกว่าและแคบกว่าการกระจายตัวอย่างก่อนหน้านี้มาก
ค่าเฉลี่ยของการกระจายตัวอย่างนี้คือ x = μ = 4
ความแปรปรวนของการแจกแจงตัวอย่างนี้คือ s2 = σ2 / n = 1.33 / 30 = 0.044
การกระจายตัวของไคสแควร์
สมมติว่าจำนวนสัตว์เลี้ยงต่อครอบครัวในเมืองหนึ่งเป็นไปตามการกระจายไคสแควร์โดยมีระดับความอิสระสามระดับ หากเราสร้างฮิสโตแกรมเพื่อแสดงการกระจายตัวของสัตว์ตามครอบครัว มันจะมีลักษณะดังนี้:
ค่าเฉลี่ยของการแจกแจงแบบไคสแควร์คือจำนวนองศาอิสระ (df) ในกรณีนี้ μ = 3 .
ความแปรปรวนของการแจกแจงแบบไคสแควร์คือ 2 * df ในกรณีนี้ σ2 = 2 * 3 = 6
สุ่มตัวอย่างจำนวน 2 ตัว
ลองนึกภาพเราสุ่มตัวอย่าง 2 ครอบครัวจากประชากรกลุ่มนี้แล้วนับจำนวนสัตว์เลี้ยงในแต่ละครอบครัว สมมติว่าครอบครัวแรกมีสัตว์เลี้ยง 4 ตัว และครอบครัวที่สองมีสัตว์เลี้ยง 1 ตัว จำนวนสัตว์เลี้ยงโดยเฉลี่ยสำหรับตัวอย่าง 2 ครอบครัวนี้คือ 2.5
ลองจินตนาการว่าเราสุ่มตัวอย่างอีก 2 ครอบครัวจากประชากรกลุ่มนี้แล้วนับจำนวนสัตว์เลี้ยงในแต่ละครอบครัวอีกครั้ง สมมติว่าครอบครัวแรกมีสัตว์เลี้ยง 6 ตัว และครอบครัวที่สองมีสัตว์เลี้ยง 4 ตัว จำนวนสัตว์เลี้ยงโดยเฉลี่ยในกลุ่มตัวอย่าง 2 ครอบครัวนี้คือ 5 ตัว
ลองนึกภาพเราสุ่มเก็บตัวอย่างจาก 2 ครอบครัวซ้ำแล้วซ้ำเล่า และหาจำนวนสัตว์เลี้ยงโดยเฉลี่ยในแต่ละครั้ง
หากเราสร้างฮิสโตแกรมเพื่อแสดงจำนวนสัตว์เลี้ยงโดยเฉลี่ยของกลุ่มตัวอย่างทั้งหมดจาก 2 ครอบครัว จะมีลักษณะดังนี้:
ค่าเฉลี่ยของการกระจายตัวอย่างนี้คือ x = μ = 3
ความแปรปรวนของการแจกแจงตัวอย่างนี้คือ s 2 = σ 2 / n = 6/2 = 3
สุ่มตัวอย่างจำนวน 10 ตัว
ทีนี้ ลองจินตนาการว่าเราทำการทดลองเดิมซ้ำ แต่คราวนี้ เราสุ่มตัวอย่างจาก 10 ตระกูล ซ้ำแล้วซ้ำเล่า และในแต่ละครั้งก็หาจำนวนสัตว์โดยเฉลี่ยต่อตระกูล
หากเราสร้างฮิสโตแกรมเพื่อแสดงจำนวนสัตว์โดยเฉลี่ยต่อครอบครัวในกลุ่มตัวอย่างทั้งหมด 10 ตระกูล จะมีลักษณะดังนี้:
ค่าเฉลี่ยของการกระจายตัวอย่างนี้คือ x = μ = 3
ความแปรปรวนของการแจกแจงตัวอย่างนี้คือ s2 = σ2 / n = 6/10 = 0.6
สุ่มตัวอย่างจำนวน 30 ตัว
ทีนี้ ลองนึกภาพเราทำการทดลองเดิมซ้ำ แต่คราวนี้ เราสุ่มตัวอย่างจาก 30 วงศ์ครั้งแล้วครั้งเล่า และแต่ละครั้งก็หาจำนวนสัตว์โดยเฉลี่ยต่อครอบครัว
หากเราสร้างฮิสโตแกรมเพื่อแสดงจำนวนสัตว์โดยเฉลี่ยต่อครอบครัวจากตัวอย่างทั้งหมด 30 ตระกูล จะมีลักษณะดังนี้:
ค่าเฉลี่ยของการกระจายตัวอย่างนี้คือ x = μ = 3
ความแปรปรวนของการแจกแจงตัวอย่างนี้คือ s2 = σ2 / n = 6/30 = 0.2
สรุป
ต่อไปนี้เป็นประเด็นหลักจากสองตัวอย่างนี้:
- การกระจายตัวของค่าเฉลี่ยตัวอย่างจะอยู่ที่ประมาณปกติ หากขนาดตัวอย่างมีขนาดใหญ่เพียงพอ แม้ว่าการกระจายตัวของประชากรจะไม่ปกติก็ตาม ในสองตัวอย่างข้างต้น การแจกแจงแบบสม่ำเสมอหรือการแจกแจงแบบไคสแควร์นั้นไม่ปกติ (พวกมันไม่ใช่รูป “ระฆัง” เลย) แต่เมื่อเราเลือกตัวอย่างที่มีขนาดใหญ่เพียงพอ การกระจายตัวของค่าเฉลี่ยตัวอย่างได้เปลี่ยนไปเป็น เป็นเรื่องปกติ
- ยิ่งขนาดตัวอย่างใหญ่ขึ้น ความแปรปรวนของค่าเฉลี่ยตัวอย่างก็จะยิ่งน้อยลง
กำหนด “ใหญ่พอ”
โปรดจำไว้ว่าทฤษฎีบทขีดจำกัดกลางระบุว่าการกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างจะค่อนข้างปกติ หากขนาดตัวอย่าง “ใหญ่เพียงพอ” แม้ว่าการกระจายตัวของประชากรจะไม่ปกติก็ตาม
ไม่มีคำจำกัดความที่แน่ชัดว่าตัวอย่างควรมีขนาดใหญ่เพียงใดเพื่อใช้ทฤษฎีบทขีดจำกัดกลาง แต่โดยทั่วไปจะขึ้นอยู่กับความเบ้ของการกระจายตัวของประชากรที่ตัวอย่างมาจาก:
- หากการกระจายตัวของประชากรเป็นแบบสมมาตร ขนาดของกลุ่มตัวอย่างที่เล็กเพียง 15 คนก็เพียงพอแล้วในบางครั้ง
- หากการกระจายตัวของประชากรบิดเบือน โดยปกติจะต้องมีกลุ่มตัวอย่างอย่างน้อย 30 คน
- หากการกระจายตัวของประชากรบิดเบือนอย่างมาก อาจจำเป็นต้องมีกลุ่มตัวอย่างตั้งแต่ 40 คนขึ้นไป
ดูบทช่วยสอนเกี่ยวกับ การปรับสภาพตัวอย่างขนาดใหญ่ เพื่อดูข้อมูลเพิ่มเติมในหัวข้อนี้