เหตุใดค่าเฉลี่ยจึงมีความสำคัญในสถิติ?


ค่า เฉลี่ย ของชุดข้อมูลแสดงถึงค่าเฉลี่ยของชุดข้อมูล มีการคำนวณดังนี้:

ค่าเฉลี่ย = Σx i / n

ทอง:

  • Σ: สัญลักษณ์ที่หมายถึง “ผลรวม”
  • x i : การสังเกต ครั้งที่ 1 ในชุดข้อมูล
  • n: จำนวนการสังเกตทั้งหมดในชุดข้อมูล

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้พร้อมข้อสังเกต 11 รายการ:

ชุดข้อมูล: 3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17

ค่าเฉลี่ยของชุดข้อมูลคำนวณดังนี้:

ค่าเฉลี่ย = (3+4+4+6+7+8+12+13+15+16+17) / 11 = 9.54

ในทางสถิติ ค่าเฉลี่ยมีความสำคัญด้วยเหตุผลดังต่อไปนี้:

1. ค่าเฉลี่ยช่วยให้เราทราบว่า “ศูนย์กลาง” ของชุดข้อมูลอยู่ที่ไหน

2. เนื่องจากวิธีการคำนวณ ค่าเฉลี่ยจึงมีข้อมูลจาก การสังเกต แต่ละครั้ง ในชุดข้อมูล

ตัวอย่างต่อไปนี้แสดงให้เห็นถึงเหตุผลสองประการนี้

ตัวอย่าง: คำนวณค่าเฉลี่ยของชุดข้อมูล

สมมติว่าเรามีชุดข้อมูลที่มีราคาขายของบ้านที่แตกต่างกัน 10,000 หลังในเมืองหนึ่งๆ

แทนที่จะดู ข้อมูลดิบ หลายพันแถว เราสามารถคำนวณค่าเฉลี่ยเพื่อทำความเข้าใจราคาขายเฉลี่ยของบ้านในเมืองนั้นได้อย่างรวดเร็ว

การรู้ว่าราคาขายเฉลี่ยอยู่ที่ 297,000 ดอลลาร์ทำให้เรามีความคิดว่าบ้าน “ทั่วไป” ขายในราคาเท่าใดในเมืองนี้

ค่าเฉลี่ยเพียงค่าเดียวนี้ตีความได้ง่ายกว่าการดูข้อมูลดิบทุกแถว

และเนื่องจากราคาขายบ้านแต่ละหลังถูกนำมาใช้ในการคำนวณค่าเฉลี่ย เราจึงสามารถคูณราคาขายเฉลี่ยด้วยจำนวนบ้านทั้งหมดเพื่อหาราคาขายรวมของบ้านทั้งหมดในเมืองนั้นได้:

  • ราคาขายรวมของบ้านทั้งหมด = ราคาขายเฉลี่ย * จำนวนบ้าน
  • ราคาขายรวมของบ้านทั้งหมด = 297,000 เหรียญสหรัฐ * 10,000
  • ราคาขายรวมของบ้านทั้งหมด = 2,970,000,000 เหรียญสหรัฐ

เราจะเห็นว่าราคาขายรวมของบ้านทั้งหมดในเมืองนี้อยู่ที่ 2.97 พันล้านดอลลาร์

เมื่อใดจึงควรใช้ค่าเฉลี่ย

เมื่อวิเคราะห์ชุดข้อมูล เรามักจะต้องการเข้าใจว่าค่ากลางอยู่ที่ใด

ในทางสถิติ มีหน่วยวัดทั่วไปสองหน่วยที่เราใช้ในการวัดศูนย์กลางของชุดข้อมูล:

  • Mean : ค่าเฉลี่ยในชุดข้อมูล
  • ค่า มัธยฐาน : ค่ามัธยฐานในชุดข้อมูล

ค่าเฉลี่ยเป็นวิธีที่ใช้กันทั่วไปในการวัดศูนย์กลางของชุดข้อมูล แต่จริงๆ แล้วอาจทำให้เข้าใจผิดได้ในสถานการณ์ต่อไปนี้:

เพื่ออธิบายสิ่งนี้ ให้พิจารณาสองตัวอย่างต่อไปนี้

ตัวอย่างที่ 1: การคำนวณค่าเฉลี่ยของการแจกแจงแบบเบ้

พิจารณาการกระจายเงินเดือนต่อไปนี้สำหรับผู้อยู่อาศัยในเมืองใดเมืองหนึ่ง:

ค่าจ้างที่สูงทางด้านขวาของการแจกแจงจะผลักค่าเฉลี่ยออกจากศูนย์กลางของการแจกแจง

ดังนั้นค่ามัธยฐานจึงสะท้อนถึงเงินเดือน “ปกติ” ของผู้อยู่อาศัยได้ดีกว่าค่าเฉลี่ย เนื่องจากการกระจายจะเบ้ไปทางขวา

ในตัวอย่างนี้ เงินเดือนโดยเฉลี่ยอยู่ที่ 47,000 เหรียญสหรัฐฯ ในขณะที่เงินเดือนเฉลี่ยอยู่ที่ 32,000 เหรียญสหรัฐฯ

ดังนั้นค่ามัธยฐานจึงเป็นตัวแทนของเงินเดือนทั่วไปในเมืองนั้นมากกว่ามาก

ตัวอย่างที่ 2: การคำนวณค่าเฉลี่ยเมื่อมีค่าผิดปกติ

พิจารณากราฟต่อไปนี้ซึ่งแสดงพื้นที่เป็นตารางฟุตของบ้านบนถนนเส้นหนึ่ง:

เมื่อใดควรใช้ค่าเฉลี่ยกับค่ามัธยฐาน

ค่าเฉลี่ยได้รับอิทธิพลอย่างมากจากบ้านหลังใหญ่มากบางหลัง ในขณะที่ค่ามัธยฐานไม่ได้รับอิทธิพล

เราจะเห็นว่าค่ามัธยฐานทำงานได้ดีกว่าในการจับภาพพื้นที่เป็นตารางฟุต “ทั่วไป” ของบ้านบนถนนเส้นนั้นมากกว่าค่าเฉลี่ย เนื่องจากไม่ได้รับอิทธิพลจากค่าผิดปกติ

สรุป

นี่เป็นบทสรุปโดยย่อเกี่ยวกับประเด็นหลักจากบทความนี้:

  • ค่าเฉลี่ยแสดงถึงค่าเฉลี่ยในชุดข้อมูล
  • ค่าเฉลี่ยมีความสำคัญเนื่องจากช่วยให้เราทราบว่าค่ากลางอยู่ที่ใดในชุดข้อมูล
  • ค่าเฉลี่ยก็มีความสำคัญเช่นกันเนื่องจากมีข้อมูลจากการสังเกต แต่ละครั้ง ในชุดข้อมูล
  • ค่าเฉลี่ยอาจทำให้เข้าใจผิดได้เมื่อชุดข้อมูลบิดเบี้ยวหรือมีค่าผิดปกติ ในสถานการณ์เหล่านี้ ค่ามัธยฐานจะให้แนวคิดที่แม่นยำมากขึ้นว่า “ศูนย์กลาง” ของชุดข้อมูลอยู่ที่ไหน

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับสถิติเชิงพรรณนาอื่นๆ:

เหตุใดค่ามัธยฐานจึงมีความสำคัญในสถิติ?
เหตุใดค่าเบี่ยงเบนมาตรฐานจึงมีความสำคัญในสถิติ
เมื่อใดควรใช้ค่าเฉลี่ยกับค่ามัธยฐาน

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *