ข้อดีและข้อเสียของการใช้ค่ามัธยฐานในสถิติ
ค่ามัธยฐาน แสดงถึงค่ากลางของชุดข้อมูล
คำนวณโดยการเรียงลำดับการสังเกตทั้งหมดในชุดข้อมูลจากน้อยไปมาก จากนั้นระบุค่ามัธยฐาน
มีข้อดีหลักสองประการในการใช้ค่ามัธยฐานเพื่ออธิบายศูนย์กลางของชุดข้อมูล:
ข้อได้เปรียบ #1: ค่ามัธยฐานไม่ได้รับผลกระทบจากค่าผิดปกติ เนื่องจากค่ามัธยฐานจะค้นหาเฉพาะค่าตรงกลางของชุดข้อมูล จึงไม่ได้รับผลกระทบจากค่าที่เล็กมากหรือใหญ่มากที่ปลายด้านใดด้านหนึ่งของชุดข้อมูล
ข้อได้เปรียบ #2: ค่ามัธยฐานเป็นตัววัดที่ดีของศูนย์กลางสำหรับชุดข้อมูลที่บิดเบี้ยว เมื่อชุดข้อมูลเอียงไป ทางซ้ายหรือขวา ค่ามัธยฐานยังคงสามารถระบุค่ากลางของชุดข้อมูลได้ ซึ่งแตกต่างจากค่าเฉลี่ยที่ได้รับผลกระทบอย่างมากจากการแจกแจงที่บิดเบี้ยว
อย่างไรก็ตาม การใช้ค่ามัธยฐานเพื่อสรุปชุดข้อมูลอาจมีข้อเสียอยู่ 2 ประการ:
ข้อเสีย #1: ค่ามัธยฐานไม่ได้ใช้การสังเกตทั้งหมดในชุดข้อมูลในการคำนวณ ในทางสถิติ โดยทั่วไปเรากล่าวว่าเป็นสิ่งที่ดีถ้าเราสามารถใช้ การสังเกต ทั้งหมดในชุดข้อมูลได้ เนื่องจากเราจะใช้ข้อมูลทั้งหมดที่มีอยู่จากข้อมูลของเรา อย่างไรก็ตาม ค่ามัธยฐานไม่ได้คำนึงถึงข้อมูลจากค่าที่น้อยมากหรือมากในชุดข้อมูล
ข้อเสีย #2: ค่ามัธยฐานไม่สามารถใช้หาผลรวมของการสังเกตทั้งหมดในชุดข้อมูลได้ หากเราทราบค่าเฉลี่ยและขนาดตัวอย่างรวมของชุดข้อมูล เราก็จะสามารถหาผลรวมของค่าทั้งหมดในชุดข้อมูลได้ อย่างไรก็ตาม เราไม่สามารถทำสิ่งเดียวกันกับค่ามัธยฐานได้
ตัวอย่างต่อไปนี้แสดงให้เห็นถึงข้อดีและข้อเสียเหล่านี้ในทางปฏิบัติ
ตัวอย่างที่ 1: ข้อดีของการใช้ค่ามัธยฐาน
สมมติว่าเรามีการกระจายเงินเดือนที่บิดเบือนมาก และเราตัดสินใจคำนวณทั้งเงินเดือนโดยเฉลี่ยและค่ามัธยฐาน:
ค่าเฉลี่ยบอกเราว่าบุคคลทั่วไปมีรายได้ประมาณ $47,000 ต่อปี ในขณะที่ค่ามัธยฐานบอกเราว่าบุคคลทั่วไปมีรายได้เพียงประมาณ $32,000 ต่อปี ซึ่งเป็นตัวแทนของบุคคลทั่วไปมากกว่ามาก
ในตัวอย่างนี้ ค่าเฉลี่ยจะได้รับผลกระทบจากค่าสูงสุดทางด้านขวาของการแจกแจง ในขณะที่ค่ามัธยฐานไม่ได้รับผลกระทบจากค่ามัธยฐาน
หรือสมมติว่าเรามีการกระจายแบบอื่นที่มีข้อมูลเกี่ยวกับพื้นที่เป็นตารางฟุตของบ้านบนถนนเส้นหนึ่ง และเราตัดสินใจคำนวณทั้งค่าเฉลี่ยและค่ามัธยฐานของชุดข้อมูล:
ค่าเฉลี่ยได้รับอิทธิพลจากบ้านหลังใหญ่มากบางหลัง ส่งผลให้ต้องใช้มูลค่าที่สูงกว่ามาก
อย่างไรก็ตาม ค่ามัธยฐานไม่ได้รับผลกระทบจากค่าผิดปกติเหล่านี้ ดังนั้นจึงให้การวัดพื้นที่เป็นตารางฟุต “ทั่วไป” ของบ้านบนถนนสายนั้นได้ดีกว่ามาก
ตัวอย่างที่ 2: ข้อเสียของการใช้ค่ามัธยฐาน
ให้เรานึกถึงข้อเสียประการแรกที่อาจเกิดขึ้นของค่ามัธยฐาน:
ข้อเสีย #1: ค่ามัธยฐานไม่ได้ใช้การสังเกตทั้งหมดในชุดข้อมูลในการคำนวณ
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่แสดงการกระจายคะแนนสอบของนักเรียนในชั้นเรียน:
การให้คะแนน: 68, 70, 71, 75, 78, 82, 83 , 83, 85, 90, 91, 91, 92
คะแนนเฉลี่ยในการสอบคือ 83
ตอนนี้ สมมติว่าเรามีชุดข้อมูลเดียวกัน แต่คะแนนสอบต่ำสุดสามคะแนนต่ำกว่ามาก:
การให้คะแนน: 22, 35, 38, 75, 78, 82, 83 , 83, 85, 90, 91, 91, 92
คะแนนสอบมัธยฐานในการแจกแจงนี้ยังคงเป็น 83
นี่คือเหตุผลที่เราบอกว่าค่ามัธยฐานไม่ได้ใช้ข้อมูลทั้งหมดที่มีอยู่ในชุดข้อมูล: มันไม่ได้คำนึงถึงค่าที่แท้จริงของข้อมูลเนื่องจากเป็นเพียงการวัดตำแหน่งเท่านั้น
ทีนี้ลองนึกถึงข้อเสียประการที่สองของค่ามัธยฐาน:
ข้อเสีย #2: ค่ามัธยฐานไม่สามารถใช้หาผลรวมของการสังเกตทั้งหมดในชุดข้อมูลได้
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับยอดขายรวมของพนักงาน 11 คนในแต่ละไตรมาส:
ยอดขาย: 12, 12, 15, 19, 22, 24 , 28, 30, 32, 35, 38
เรารู้ว่าค่ามัธยฐานคือ 24 และเรารู้ว่ามีพนักงานทั้งหมด 11 คน อย่างไรก็ตาม เราไม่สามารถใช้ข้อมูลนี้เพื่อทราบยอดขายรวมของพนักงานทุกคนได้
ในทางกลับกัน หากเรารู้ว่าค่าเฉลี่ยคือ 24 และมีพนักงานทั้งหมด 11 คน เราก็สามารถคูณ 24 ด้วย 11 เพื่อหาผลรวมของยอดขายคือ 24 * 11 = 264
หมายเหตุ : ขึ้นอยู่กับการกระจายข้อมูลของคุณและปัญหาที่คุณพยายามแก้ไข ค่าเฉลี่ยหรือค่ามัธยฐานอาจเป็นหน่วยเมตริกที่คุณต้องการใช้
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับค่าเฉลี่ยและค่ามัธยฐานในสถิติ:
ค่าผิดปกติส่งผลต่อค่าเฉลี่ยอย่างไร
วิธีประมาณค่าเฉลี่ยและค่ามัธยฐานของฮิสโตแกรมใดๆ
วิธีหาค่าเฉลี่ยและค่ามัธยฐานของแปลงต้นและใบ