เมื่อใดควรใช้ mean vs. ค่ามัธยฐาน: พร้อมตัวอย่าง


ค่า เฉลี่ย ของชุดข้อมูลแสดงถึงค่าเฉลี่ยของชุดข้อมูล มีการคำนวณดังนี้:

ค่าเฉลี่ย = Σx i / n

ทอง:

  • Σ: สัญลักษณ์ที่หมายถึง “ผลรวม”
  • x i : การสังเกต ครั้งที่ 1 ในชุดข้อมูล
  • n: จำนวนการสังเกตทั้งหมดในชุดข้อมูล

ค่ามัธยฐาน แสดงถึงค่ากลางของชุดข้อมูล คำนวณโดยการเรียงลำดับการสังเกตทั้งหมดในชุดข้อมูลจากน้อยไปมาก จากนั้นระบุค่ามัธยฐาน

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้พร้อม ข้อสังเกต 11 รายการ :

ชุดข้อมูล: 3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17

ค่าเฉลี่ยของชุดข้อมูลคำนวณดังนี้:

ค่าเฉลี่ย = (3+4+4+6+7+8+12+13+15+16+17) / 11 = 9.54

ค่ามัธยฐานของชุดข้อมูลคือค่าที่อยู่ตรงกลางซึ่งกลายเป็น 8:

3, 4, 4, 6, 7 , 8, 12, 13, 15, 16, 17

ค่าประมาณเฉลี่ยและค่ามัธยฐานของตำแหน่ง ศูนย์กลาง ของชุดข้อมูล อย่างไรก็ตาม ขึ้นอยู่กับลักษณะของข้อมูล ค่าเฉลี่ยหรือค่ามัธยฐานอาจมีประโยชน์มากกว่าในการอธิบายศูนย์กลางของชุดข้อมูล

เมื่อใดจึงควรใช้ค่าเฉลี่ย

วิธีที่ดีที่สุดคือใช้ ค่าเฉลี่ย เพื่ออธิบายศูนย์กลางของชุดข้อมูล เมื่อการกระจายมี ความสมมาตร และไม่มีค่าผิดปกติ

ตัวอย่างเช่น สมมติว่าเรามีการกระจายต่อไปนี้ซึ่งแสดงเงินเดือนของผู้อยู่อาศัยในเมืองหนึ่งๆ:

เนื่องจากการแจกแจงนี้ค่อนข้างสมมาตร (ถ้าคุณแบ่งมันลงตรงกลาง แต่ละครึ่งจะดูเท่ากันโดยประมาณ) และไม่มีค่าผิดปกติ เราจึงใช้ค่าเฉลี่ยเพื่ออธิบายศูนย์กลางของชุดข้อมูลนี้ได้

ค่าเฉลี่ยกลายเป็น 63,000 ดอลลาร์ ซึ่งอยู่ตรงกลางของการกระจายโดยประมาณ:

เมื่อใดจึงจะใช้ค่ามัธยฐาน

วิธีที่ดีที่สุดคือใช้ค่ามัธยฐานเมื่อการแจกแจง บิดเบือน หรือเมื่อมีค่าผิดปกติ

ข้อมูลที่บิดเบี้ยว:

เมื่อการแจกแจงบิดเบี้ยว ค่ามัธยฐานจะอธิบายจุดศูนย์กลางของการแจกแจงได้ดีกว่าค่าเฉลี่ย

ตัวอย่างเช่น พิจารณาการกระจายเงินเดือนของผู้อยู่อาศัยในเมืองใดเมืองหนึ่งดังต่อไปนี้:

ค่ามัธยฐานสะท้อนถึงเงินเดือน “ทั่วไป” ของผู้อยู่อาศัยได้ดีกว่าค่าเฉลี่ย เนื่องจากค่าสูงที่ส่วนท้ายของการแจกแจงมีแนวโน้มที่จะผลักค่าเฉลี่ยออกจากจุดศูนย์กลางไปทางหางยาว

ในตัวอย่างนี้ ค่าเฉลี่ยบอกเราว่าบุคคลทั่วไปมีรายได้ประมาณ $47,000 ต่อปี ในขณะที่ค่ามัธยฐานบอกเราว่าบุคคลทั่วไปมีรายได้เพียงประมาณ $32,000 ต่อปี ซึ่งเป็นตัวแทนของบุคคลทั่วไปมากกว่ามาก

ค่าผิดปกติ:

ค่ามัธยฐานยังช่วยให้จับตำแหน่งศูนย์กลางของการแจกแจงได้ดีขึ้นเมื่อมีค่าผิดปกติในข้อมูล ตัวอย่างเช่น ลองพิจารณากราฟต่อไปนี้ซึ่งแสดงพื้นที่เป็นตารางฟุตของบ้านบนถนนเส้นหนึ่ง:

เมื่อใดควรใช้ค่าเฉลี่ยกับค่ามัธยฐาน

ค่าเฉลี่ยได้รับอิทธิพลอย่างมากจากบ้านหลังใหญ่มากบางหลัง ในขณะที่ค่ามัธยฐานไม่ได้รับอิทธิพล ดังนั้นค่ามัธยฐานจึงทำงานได้ดีกว่าในการจับภาพพื้นที่เป็นตารางฟุต “ทั่วไป” ของบ้านบนถนนเส้นนั้นมากกว่าค่าเฉลี่ย

สรุป

สรุป:

  • ค่าเฉลี่ยและค่ามัธยฐานสามารถใช้เพื่ออธิบายว่า “ศูนย์กลาง” ของชุดข้อมูลอยู่ที่ไหน
  • ควรใช้ค่าเฉลี่ยเมื่อการกระจายค่าข้อมูลมีความสมมาตรและไม่มีค่าผิดปกติที่ชัดเจน
  • วิธีที่ดีที่สุดคือใช้ค่ามัธยฐานเมื่อการกระจายค่าข้อมูลบิดเบือนหรือเมื่อมีค่าผิดปกติที่ชัดเจน

แหล่งข้อมูลเพิ่มเติม

ค่าผิดปกติส่งผลต่อค่าเฉลี่ยอย่างไร
วิธีประมาณค่าเฉลี่ยและค่ามัธยฐานของฮิสโตแกรมใดๆ
วิธีหาค่าเฉลี่ยและค่ามัธยฐานของแปลงต้นและใบ

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *