การกระจายตัวอย่าง
บทความนี้จะอธิบายว่าการกระจายตัวอย่างในสถิติคืออะไร และใช้เพื่ออะไร ดังนั้นคุณจะพบความหมายของการกระจายตัวอย่าง ตัวอย่างที่ชัดเจนของการกระจายตัวอย่าง และสูตรเพิ่มเติมสำหรับการแจกแจงตัวอย่างประเภทที่พบบ่อยที่สุด
การกระจายตัวอย่างคืออะไร?
การกระจายตัวอย่าง หรือ การกระจายตัวอย่าง คือการกระจายที่เป็นผลจากการพิจารณาตัวอย่างที่เป็นไปได้ทั้งหมดจากประชากร กล่าวอีกนัยหนึ่ง การกระจายตัวอย่างคือการกระจายที่ได้รับจากการคำนวณพารามิเตอร์การสุ่มตัวอย่างที่เป็นไปได้ทั้งหมดจากประชากร
ตัวอย่างเช่น ถ้าเราแยกตัวอย่างที่เป็นไปได้ทั้งหมดออกจากประชากรทางสถิติและคำนวณค่าเฉลี่ยของแต่ละตัวอย่าง ชุดของค่าเฉลี่ยของตัวอย่างจะก่อให้เกิดการแจกแจงตัวอย่าง แม่นยำยิ่งขึ้น เนื่องจากพารามิเตอร์ที่คำนวณได้คือค่าเฉลี่ยเลขคณิต จึงเป็นการกระจายตัวตัวอย่างของค่าเฉลี่ย
ในสถิติ การกระจายตัวอย่างใช้เพื่อคำนวณความน่าจะเป็นที่จะเข้าใกล้ค่าพารามิเตอร์ประชากรเมื่อศึกษาตัวอย่างเดียว ในทำนองเดียวกัน การกระจายตัวอย่างช่วยให้เราสามารถประมาณค่าข้อผิดพลาดในการสุ่มตัวอย่างสำหรับขนาดตัวอย่างที่กำหนดได้
ตัวอย่างการกระจายตัวอย่าง
ตอนนี้เราทราบคำจำกัดความของการกระจายตัวอย่างแล้ว เรามาดูตัวอย่างง่ายๆ เพื่อทำความเข้าใจแนวคิดนี้อย่างถ่องแท้กันดีกว่า
- ในกล่องเราใส่ลูกบอล 3 ลูก แต่ละลูกมีตัวเลขเขียนตั้งแต่ 1 ถึง 3 โดยลูกหนึ่งมีหมายเลข 1 อีกลูกหนึ่งมีหมายเลข 2 และลูกสุดท้ายมีหมายเลข 3 สำหรับตัวอย่างขนาด n = 2 คำนวณความน่าจะเป็นของการกระจายตัวตัวอย่างของค่าเฉลี่ย หากเลือกตัวอย่างที่มีการแทนที่
ตัวอย่างจะถูกเลือกพร้อมการทดแทน นั่นคือ ลูกบอลที่หยิบขึ้นมาเพื่อเลือกองค์ประกอบแรกของตัวอย่างจะถูกส่งกลับไปยังกล่องและสามารถเลือกได้อีกครั้งในระหว่างการสกัดครั้งที่สอง ดังนั้น ตัวอย่างที่เป็นไปได้ทั้งหมดจากประชากรคือ:
1.1 1.2 1.3
2.1 2.2 2.3
3.1 3.2 3.3
ดังนั้นเราจึงคำนวณค่าเฉลี่ยเลขคณิตของแต่ละตัวอย่างที่เป็นไปได้:
ดังนั้น ความน่าจะเป็นที่จะได้แต่ละค่าของค่าเฉลี่ยตัวอย่างเมื่อเลือกตัวอย่างสุ่มจากประชากรจึงเป็นดังนี้
ความน่าจะเป็นของการกระจายตัวอย่างที่แสดงในตารางด้านบนคำนวณโดยการหารจำนวนตัวอย่างที่มีค่าเฉลี่ยดังกล่าวด้วยจำนวนกรณีที่เป็นไปได้ทั้งหมด ตัวอย่างเช่น: ค่าเฉลี่ยตัวอย่างคือ 1.5 ในสองกรณีจากเก้าที่เป็นไปได้ ดังนั้น P(1.5)=2/9
ประเภทของการกระจายตัวอย่าง
การแจกแจงการสุ่มตัวอย่าง (หรือการแจกแจงการสุ่มตัวอย่าง) สามารถจำแนกตามพารามิเตอร์การสุ่มตัวอย่างที่ได้รับ ดังนั้นประเภทการแจกแจงที่พบบ่อยที่สุดมีดังนี้:
- การกระจายตัวอย่างค่าเฉลี่ย : นี่คือการกระจายตัวอย่างที่เกิดจากการคำนวณค่าเฉลี่ยเลขคณิตของแต่ละตัวอย่าง
- การกระจายตัวอย่างตามสัดส่วน : เป็นการกระจายตัวอย่างที่ได้จากการคำนวณสัดส่วนของกลุ่มตัวอย่างทั้งหมด
- การกระจายตัวอย่างความแปรปรวน : นี่คือการกระจายตัวอย่างที่สร้างชุดของความแปรปรวนทั้งหมดในตัวอย่าง
- ความแตกต่างของค่าเฉลี่ยการกระจายตัวอย่าง : คือการกระจายตัวอย่างที่เกิดจากการคำนวณความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างที่เป็นไปได้ทั้งหมดจากประชากรสองกลุ่มที่แตกต่างกัน
- ความแตกต่างในการกระจายตัวอย่างตามสัดส่วน : คือการกระจายตัวอย่างที่ได้รับโดยการลบสัดส่วนตัวอย่างที่เป็นไปได้ทั้งหมดออกจากประชากรสองกลุ่ม
การกระจายตัวอย่างแต่ละประเภทมีคำอธิบายโดยละเอียดด้านล่าง
การกระจายตัวอย่างค่าเฉลี่ย
เมื่อพิจารณาจากประชากรที่เป็นไปตามการแจกแจงความน่าจะเป็นแบบปกติด้วยค่าเฉลี่ย
และค่าเบี่ยงเบนมาตรฐาน
และดึงตัวอย่างขนาดออกมา
การกระจายตัวตัวอย่างของค่าเฉลี่ยจะถูกกำหนดโดยการแจกแจงแบบปกติที่มีลักษณะดังต่อไปนี้:
ทอง
คือค่าเฉลี่ยของการกระจายตัวตัวอย่างของค่าเฉลี่ยและ
คือค่าเบี่ยงเบนมาตรฐาน นอกจากนี้,
คือค่าคลาดเคลื่อนมาตรฐานของการกระจายตัวตัวอย่าง
หมายเหตุ: หากประชากรไม่เป็นไปตามการแจกแจงแบบปกติแต่ขนาดของกลุ่มตัวอย่างมีขนาดใหญ่ (n>30) การกระจายตัวตัวอย่างของค่าเฉลี่ยก็สามารถประมาณได้กับการแจกแจงแบบปกติด้านบนด้วยขีดจำกัดทฤษฎีบทกลาง
ดังนั้น เนื่องจากการกระจายตัวตัวอย่างของค่าเฉลี่ยเป็นไปตามการแจกแจงแบบปกติ สูตรในการคำนวณความน่าจะเป็นใดๆ ที่เกี่ยวข้องกับค่าเฉลี่ยตัวอย่าง จึงเป็นดังนี้:
ทอง:
-
คือค่าเฉลี่ยตัวอย่าง
-
นี่คือค่าเฉลี่ยประชากร
-
คือค่าเบี่ยงเบนมาตรฐานประชากร
-
คือขนาดตัวอย่าง
-
เป็นตัวแปรที่กำหนดโดยการแจกแจงแบบปกติมาตรฐาน N(0,1)
การกระจายตัวอย่างตามสัดส่วน
ที่จริงแล้ว เมื่อเราศึกษาสัดส่วนของกลุ่มตัวอย่าง เราจะวิเคราะห์กรณีความสำเร็จ ดังนั้น ตัวแปรสุ่มในการศึกษาจึงเป็นไปตามการแจกแจงความน่าจะเป็นแบบทวินาม
ตามทฤษฎีบทขีดจำกัดกลาง สำหรับขนาดใหญ่ (n>30) เราสามารถทำให้การแจกแจงแบบทวินามเข้าใกล้การแจกแจงแบบปกติมากขึ้น ดังนั้น การกระจายตัวอย่างตามสัดส่วนจะใกล้เคียงกับการแจกแจงแบบปกติด้วยพารามิเตอร์ต่อไปนี้:
ทอง
คือความน่าจะเป็นของความสำเร็จและ
คือความน่าจะเป็นที่จะล้มเหลว
.
หมายเหตุ: การแจกแจงแบบทวินามสามารถประมาณได้เฉพาะกับการแจกแจงแบบปกติเท่านั้น
และ
.
ดังนั้น เนื่องจากการกระจายตัวของสัดส่วนตัวอย่างสามารถประมาณได้กับการแจกแจงแบบปกติ สูตรในการคำนวณความน่าจะเป็นใดๆ ที่เกี่ยวข้องกับสัดส่วนของกลุ่มตัวอย่าง จึงเป็นดังนี้:
ทอง:
-
คือสัดส่วนตัวอย่าง
-
คือสัดส่วนของประชากร
-
คือความน่าจะเป็นที่จะล้มเหลวของประชากร
.
-
คือขนาดตัวอย่าง
-
เป็นตัวแปรที่กำหนดโดยการแจกแจงแบบปกติมาตรฐาน N(0,1)
การกระจายตัวอย่างความแปรปรวน
การกระจายตัวอย่างความแปรปรวนถูกกำหนดโดยการแจกแจงความน่าจะเป็นแบบไคสแควร์ ดังนั้น สูตรสำหรับสถิติการกระจายตัวอย่างความแปรปรวน คือ:
ทอง:
-
คือสถิติของการกระจายตัวตัวอย่างของความแปรปรวน ซึ่งเป็นไปตามการแจกแจงแบบไคสแควร์
-
คือขนาดตัวอย่าง
-
คือความแปรปรวนตัวอย่าง
-
คือความแปรปรวนของประชากร
การสุ่มตัวอย่างการกระจายตัวของผลต่างของค่าเฉลี่ย
หากขนาดตัวอย่างใหญ่เพียงพอ (n 1 ≥30 และ n 2 ≥30) การกระจายตัวตัวอย่างของผลต่างเฉลี่ยจะเป็นไปตามการแจกแจงแบบปกติ แม่นยำยิ่งขึ้นพารามิเตอร์ของการแจกแจงดังกล่าวจะถูกคำนวณดังนี้:
หมายเหตุ: หากประชากรทั้งสองเป็นการแจกแจงแบบปกติ การกระจายตัวตัวอย่างของความแตกต่างในค่าเฉลี่ยจะเป็นไปตามการแจกแจงแบบปกติโดยไม่คำนึงถึงขนาดตัวอย่าง
ดังนั้น เนื่องจากการกระจายตัวตัวอย่างของความแตกต่างในค่าเฉลี่ยถูกกำหนดโดยการแจกแจงแบบปกติ สูตรในการคำนวณสถิติของการกระจายตัวอย่างของความแตกต่าง ในค่าเฉลี่ยจึงเป็นดังนี้
ทอง:
-
คือค่าเฉลี่ยของกลุ่มตัวอย่าง i
-
คือค่าเฉลี่ยของประชากร i
-
คือค่าเบี่ยงเบนมาตรฐานของประชากร i
-
คือขนาดตัวอย่าง i
-
เป็นตัวแปรที่กำหนดโดยการแจกแจงแบบปกติมาตรฐาน N(0,1)
โปรดทราบว่าตัวอย่างจากประชากรที่แตกต่างกันอาจมีขนาดตัวอย่างที่แตกต่างกัน
การกระจายตัวอย่างความแตกต่างในสัดส่วน
ตัวอย่างที่เลือกสำหรับความแตกต่างในสัดส่วนของการกระจายตัวอย่างจะถูกกำหนดโดยการแจกแจงแบบทวินาม เนื่องจากในทางปฏิบัติ สัดส่วนคืออัตราส่วนของกรณีความสำเร็จต่อจำนวนการสังเกตทั้งหมด
อย่างไรก็ตาม เนื่องจากทฤษฎีบทขีดจำกัดกลาง การแจกแจงแบบทวินามจึงสามารถประมาณได้กับการแจกแจงความน่าจะเป็นแบบปกติ ดังนั้นการกระจายตัวอย่างส่วนต่างในสัดส่วนสามารถประมาณได้กับการแจกแจงแบบปกติโดยมีลักษณะดังต่อไปนี้
หมายเหตุ: การกระจายตัวตัวอย่างของความแตกต่างในสัดส่วนสามารถประมาณได้เฉพาะกับการแจกแจงแบบปกติเท่านั้น
,
,
,
,
และ
.
ดังนั้น เนื่องจากการกระจายตัวตัวอย่างของส่วนต่างในสัดส่วนสามารถประมาณได้กับการแจกแจงแบบปกติ สูตรในการคำนวณสถิติของการกระจายตัวตัวอย่างของส่วนต่างในสัดส่วน จึงเป็นดังนี้
ทอง:
-
คือสัดส่วนตัวอย่าง i
-
คือสัดส่วนของประชากร i
-
คือความน่าจะเป็นที่จะเกิดความล้มเหลวของประชากร i
.
-
คือขนาดตัวอย่าง i
-
เป็นตัวแปรที่กำหนดโดยการแจกแจงแบบปกติมาตรฐาน N(0,1)