ข้อดีและข้อเสียของการใช้ค่าเฉลี่ยในสถิติ


ค่า เฉลี่ย ของชุดข้อมูลแสดงถึงค่าเฉลี่ยของชุดข้อมูล

มีการคำนวณดังนี้:

ค่าเฉลี่ย = Σx i / n

ทอง:

  • Σ: สัญลักษณ์ที่หมายถึง “ผลรวม”
  • x i : การสังเกต ครั้งที่ 1 ในชุดข้อมูล
  • n: จำนวนการสังเกตทั้งหมดในชุดข้อมูล

มีข้อดีหลักสองประการในการใช้ค่าเฉลี่ยเพื่ออธิบาย “ศูนย์กลาง” หรือ “ค่าเฉลี่ย” ของชุดข้อมูล:

ข้อได้เปรียบ #1: ค่าเฉลี่ยใช้การสังเกตทั้งหมดจากชุดข้อมูลในการคำนวณ ในด้านสถิติ โดยทั่วไปนี่เป็นสิ่งที่ดีเพราะว่ากันว่าเป็นการใช้ข้อมูลทั้งหมดที่มีอยู่ในชุดข้อมูล

ข้อดี #2: ค่าเฉลี่ยนั้นง่ายต่อการคำนวณและตีความ ค่าเฉลี่ยคือผลรวมของการสังเกตทั้งหมดหารด้วยจำนวนการสังเกตทั้งหมด ง่ายต่อการคำนวณ (แม้ด้วยตนเอง) และตีความได้ง่าย

อย่างไรก็ตาม การใช้ค่าเฉลี่ยเพื่อสรุปชุดข้อมูลอาจมีข้อเสียอยู่ 2 ประการ:

ข้อเสีย #1: ค่าเฉลี่ยได้รับผลกระทบจากค่าผิดปกติ หากชุดข้อมูลมีค่าผิดปกติอย่างมาก จะส่งผลต่อค่าเฉลี่ยและทำให้เป็นการวัดจุดศูนย์กลางของชุดข้อมูลที่ไม่น่าเชื่อถือ

ข้อเสีย #2: ค่าเฉลี่ยอาจทำให้เข้าใจผิดหากชุดข้อมูลที่บิดเบือน เมื่อชุดข้อมูลเอียงไป ทางซ้ายหรือขวา การหาค่าเฉลี่ยอาจเป็นวิธีการวัดศูนย์กลางของชุดข้อมูลที่ทำให้เข้าใจผิด

ตัวอย่างต่อไปนี้แสดงให้เห็นถึงข้อดีและข้อเสียเหล่านี้ในทางปฏิบัติ

ตัวอย่างที่ 1: ประโยชน์ของการใช้ค่าเฉลี่ย

สมมติว่าเรามีฮิสโตแกรมต่อไปนี้ซึ่งแสดงเงินเดือนของผู้อยู่อาศัยในเมืองใดเมืองหนึ่ง:

เนื่องจากโดยทั่วไปการแจกแจงนี้มี ความสมมาตร (หากคุณแบ่งมันไว้ตรงกลาง แต่ละครึ่งจะดูเท่ากันโดยประมาณ) และไม่มีค่าผิดปกติ ค่าเฉลี่ยจึงเป็นวิธีที่มีประโยชน์ในการอธิบายจุดศูนย์กลางของชุดข้อมูลนี้

ค่าเฉลี่ยกลายเป็น 63,000 ดอลลาร์ ซึ่งอยู่ตรงกลางของการกระจายโดยประมาณ:

ในตัวอย่างนี้ เราสามารถใช้ข้อดีทั้งสองของการหาค่าเฉลี่ยได้:

ข้อได้เปรียบ #1: ค่าเฉลี่ยใช้การสังเกตทั้งหมดจากชุดข้อมูลในการคำนวณ

เนื่องจากการกระจายตัวมีความสมมาตรเป็นหลักและไม่มีค่าผิดปกติมากนัก เราจึงสามารถใช้เงินเดือนที่มีอยู่ทั้งหมดมาคำนวณค่าเฉลี่ยได้ ซึ่งทำให้เรามีความคิดที่ดีเกี่ยวกับเงินเดือน “เฉลี่ย” หรือ “ปกติ” ในเมืองนี้โดยเฉพาะ

ข้อดี #2: ค่าเฉลี่ยนั้นง่ายต่อการคำนวณและตีความ เป็นเรื่องง่ายที่จะเข้าใจว่าเงินเดือนเฉลี่ย 63,000 ดอลลาร์แสดงถึงเงินเดือน “เฉลี่ย” ของแต่ละบุคคลในเมืองนี้

แม้ว่าบางคนมีรายได้มากกว่านี้มากและน้อยกว่ามาก แต่ค่าเฉลี่ยนี้ทำให้เรามีความคิดที่ดีเกี่ยวกับเงินเดือน “ทั่วไป” ในเมืองนี้

ตัวอย่างที่ 2: ข้อเสียของการใช้ค่าเฉลี่ย

สมมติว่าเรามีการกระจายเงินเดือนที่บิดเบือนมาก และเราตัดสินใจคำนวณทั้งเงินเดือนโดยเฉลี่ยและค่ามัธยฐาน:

ค่าที่สูงกว่าที่ส่วนท้ายของการแจกแจงจะย้ายค่าเฉลี่ยออกจากจุดศูนย์กลางไปทางหางยาว

ในตัวอย่างนี้ ค่าเฉลี่ยบอกเราว่าบุคคลทั่วไปมีรายได้ประมาณ $47,000 ต่อปี ในขณะที่ค่ามัธยฐานบอกเราว่าบุคคลทั่วไปมีรายได้เพียงประมาณ $32,000 ต่อปี ซึ่งเป็นตัวแทนของบุคคลทั่วไปมากกว่ามาก

ในตัวอย่างนี้ ค่าเฉลี่ยสรุปค่า “ทั่วไป” หรือ “ค่าเฉลี่ย” ในการแจกแจงนี้ได้ไม่ดีเนื่องจากการแจกแจงบิดเบือน

หรือสมมติว่าเรามีการกระจายแบบอื่นที่มีข้อมูลเกี่ยวกับพื้นที่เป็นตารางฟุตของบ้านบนถนนเส้นหนึ่ง และเราตัดสินใจคำนวณทั้งค่าเฉลี่ยและค่ามัธยฐานของชุดข้อมูล:

เมื่อใดควรใช้ค่าเฉลี่ยกับค่ามัธยฐาน

ค่าเฉลี่ยได้รับอิทธิพลจากบ้านหลังใหญ่มากบางหลัง ส่งผลให้ต้องใช้มูลค่าที่สูงกว่ามาก

ซึ่งทำให้ค่าพื้นที่เป็นตารางฟุตโดยเฉลี่ยทำให้เข้าใจผิด และให้ค่าพื้นที่เป็นตารางฟุต “ทั่วไป” ของบ้านบนถนนสายนั้นได้ไม่ดี

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับค่าเฉลี่ยและค่ามัธยฐานในสถิติ:

ค่าผิดปกติส่งผลต่อค่าเฉลี่ยอย่างไร
วิธีประมาณค่าเฉลี่ยและค่ามัธยฐานของฮิสโตแกรมใดๆ
วิธีหาค่าเฉลี่ยและค่ามัธยฐานของแปลงต้นและใบ

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *