ค่าเฉลี่ยตัวอย่างกับค่าเฉลี่ยประชากร: อะไรคือความแตกต่าง?
บ่อยครั้งในสถิติเราต้องการตอบคำถามเช่น:
- รายได้เฉลี่ยของครัวเรือนในเมืองใดเมืองหนึ่งคือเท่าใด
- น้ำหนักเฉลี่ยของเต่าบางสายพันธุ์คือเท่าไร?
- ผู้เข้าร่วมการแข่งขันฟุตบอลระดับวิทยาลัยโดยเฉลี่ยคือเท่าใด
ในแต่ละสถานการณ์ เราต้องการตอบคำถามเกี่ยวกับ ประชากร ซึ่งแสดงถึงองค์ประกอบแต่ละรายการที่เป็นไปได้ทั้งหมดที่เราต้องการวัด
อย่างไรก็ตาม แทนที่จะรวบรวมข้อมูลของประชากรแต่ละคน เราจะรวบรวมข้อมูลจากกลุ่มตัวอย่างประชากรแทน ซึ่งแสดงถึงส่วนหนึ่งของประชากรทั้งหมด
ตัวอย่างเช่น เราอาจต้องการทราบน้ำหนักเฉลี่ยของเต่าบางสายพันธุ์ที่มีประชากรเต่าทั้งหมด 800 ตัว
เนื่องจากการค้นหาและชั่งน้ำหนักเต่าทุกตัวในประชากรอาจใช้เวลานานเกินไป เราจึงสุ่มตัวอย่างเต่า 30 ตัวและวัดน้ำหนักของเต่าแทน:
จากนั้นเราสามารถใช้น้ำหนักเฉลี่ยของเต่าตัวอย่างนี้เพื่อประมาณน้ำหนักเฉลี่ยของเต่าทุกตัวในประชากร
วิธีการคำนวณค่าเฉลี่ยตัวอย่าง
สูตรคำนวณค่าเฉลี่ยตัวอย่างซึ่งมักเขียนแทนด้วย x มีดังต่อไปนี้:
x = Σx ฉัน / n
ทอง:
- Σ: สัญลักษณ์กรีกที่ซับซ้อนหมายถึง “ผลรวม”
- x i : ค่าของการสังเกตครั้งที่ 3 ในชุดข้อมูล
- n: ขนาดตัวอย่าง
ตัวอย่างเช่น สมมติว่าเราเก็บตัวอย่างเต่า 10 ตัว โดยมีน้ำหนัก (เป็นปอนด์) ดังต่อไปนี้:
- 70, 80, 80, 85, 90, 95, 110, 120, 140, 150
ค่าเฉลี่ยตัวอย่างจะถูกคำนวณดังนี้:
- x = (70+ 80+80+85+90+95+110+120+140+150) / 10 = 102
เหตุใดค่าเฉลี่ยตัวอย่างจึงไม่เอนเอียง
ในศัพท์เฉพาะทางสถิติ เราจะบอกว่าค่าเฉลี่ยตัวอย่างคือ สถิติ ในขณะที่ค่าเฉลี่ยประชากรคือ พารามิเตอร์
นี่คือความแตกต่างระหว่างสองคำนี้:
สถิติ คือตัวเลขที่อธิบายคุณลักษณะบางประการของกลุ่มตัวอย่าง
พารามิเตอร์ คือตัวเลขที่อธิบายคุณลักษณะของประชากร
พารามิเตอร์คือค่าที่เราต้องการวัดจริง ๆ แต่สถิติคือค่าที่เราใช้ในการประมาณค่าของพารามิเตอร์เนื่องจากสถิตินั้นหาได้ง่ายกว่ามาก
เมื่อเราใช้วิธีการเช่น การสุ่มตัวอย่างอย่างง่าย เพื่อให้ได้ตัวอย่าง เราจะบอกว่าค่าเฉลี่ยของกลุ่มตัวอย่างเป็น ตัวประมาณค่าที่เป็นกลาง ของค่าเฉลี่ยประชากร
กล่าวอีกนัยหนึ่ง เราไม่มีเหตุผลที่จะเชื่อว่าค่าเฉลี่ยของกลุ่มตัวอย่างจะประมาณค่าค่าเฉลี่ยประชากรที่แท้จริงต่ำไปหรือสูงเกินไป
เหตุผลก็คือเมื่อเราใช้วิธีการสุ่มตัวอย่างอย่างง่าย สมาชิกแต่ละคนของประชากรจะมีโอกาสถูกรวมเข้าในกลุ่มตัวอย่างเท่ากัน ซึ่งหมายความว่ากลุ่มตัวอย่างนั้นน่าจะเป็น “รุ่นย่อย” ของประชากรโดยรวม .
เราจะบอกว่ากลุ่มตัวอย่างเป็น ตัวแทนของประชากรโดยรวม ซึ่งหมายความว่าค่าเฉลี่ยของกลุ่มตัวอย่างควรเป็นค่าประมาณที่ดีของค่าเฉลี่ยประชากร โดยสมมติว่าขนาดของกลุ่มตัวอย่างมีขนาดใหญ่เพียงพอ
เรื่องการใช้ช่วงความเชื่อมั่นกับค่าเฉลี่ยตัวอย่าง
แม้ว่าค่าเฉลี่ยตัวอย่างจะให้การประมาณค่าเฉลี่ยประชากรที่เป็นกลาง แต่ก็ไม่น่าจะตรงกับค่าเฉลี่ยประชากร ทุกประการ
ตัวอย่างเช่น หากเราต้องการใช้ตัวอย่างเต่าเพื่อประมาณน้ำหนักเฉลี่ยของประชากรเต่า เราอาจเลือกตัวอย่างที่เต็มไปด้วยเต่าที่มีน้ำหนักน้อย หรือบางทีอาจเป็นตัวอย่างที่เต็มไปด้วยเต่าที่มีน้ำหนักมาก
เพื่อที่จะจับความไม่แน่นอนนี้รอบๆ การประมาณค่าเฉลี่ยประชากร เราสามารถสร้าง ช่วงความเชื่อมั่น ได้
ช่วงความเชื่อมั่นคือช่วงของค่าที่น่าจะมีพารามิเตอร์ประชากรที่มีระดับความเชื่อมั่นที่แน่นอน
ตัวอย่างเช่น เราอาจเก็บตัวอย่างเต่า 30 ตัว และพบว่าน้ำหนักเฉลี่ยของตัวอย่างนั้นคือ 102 ปอนด์ หากเราสร้างช่วงความเชื่อมั่น 95% เราอาจพบว่าช่วงดังกล่าวเป็น:
ช่วงความเชื่อมั่น 95% = [98.5, 105.5]
เราจะตีความสิ่งนี้ว่าหมายความว่ามีโอกาส 95% ที่ช่วงความเชื่อมั่นที่ [98.5, 105.5] มีน้ำหนักเฉลี่ยที่แท้จริงของประชากรเต่า
ช่วงความเชื่อมั่นนี้มีประโยชน์มากกว่าค่าเฉลี่ยตัวอย่างอย่างง่าย เพราะมันให้ ช่วง ของค่าที่ค่าเฉลี่ยประชากรที่แท้จริงมีแนวโน้มที่จะโกหก
แหล่งข้อมูลเพิ่มเติม
ประชากรเทียบกับ ตัวอย่าง: อะไรคือความแตกต่าง?
สถิติเทียบกับ พารามิเตอร์: อะไรคือความแตกต่าง?
ข้อมูลเบื้องต้นเกี่ยวกับช่วงความเชื่อมั่น