สิ่งที่ถือว่าเป็นค่าเบี่ยงเบนมาตรฐานที่ดี?
ค่าเบี่ยงเบนมาตรฐาน ใช้ในการวัดการกระจายของค่าในตัวอย่าง
เราสามารถใช้สูตรต่อไปนี้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างที่กำหนด:
√ Σ(x ผม – x บาร์ ) 2 / (n-1)
ทอง:
- Σ: สัญลักษณ์ที่หมายถึง “ผลรวม”
- x i : ค่า i ของกลุ่มตัวอย่าง
- x bar : หมายถึงตัวอย่าง
- n: ขนาดตัวอย่าง
ยิ่งค่าเบี่ยงเบนมาตรฐานสูง ค่าใน ตัวอย่าง ก็จะยิ่งกระจัดกระจายมากขึ้น ในทางกลับกัน ยิ่งค่าเบี่ยงเบนมาตรฐานยิ่งต่ำ ค่าต่างๆ จะถูกจัดกลุ่มให้ใกล้เคียงกันมากขึ้น
คำถามที่นักเรียนมักถามคือ ค่าเบี่ยงเบนมาตรฐานจะถือว่ามีค่าเท่าใด
คำตอบ: ค่าเบี่ยงเบนมาตรฐานไม่สามารถเป็น “ดี” หรือ “ไม่ดี” ได้ เพราะว่าค่าเบี่ยงเบนมาตรฐานเพียงบอกเราถึงการกระจายตัวของค่าในตัวอย่างเท่านั้น
นอกจากนี้ยังไม่มีหมายเลขสากลในการพิจารณาว่าค่าเบี่ยงเบนมาตรฐานคือ “สูง” หรือ “ต่ำ” ตัวอย่างเช่น พิจารณาสถานการณ์ต่อไปนี้:
สถานการณ์ที่ 1: ตัวแทนอสังหาริมทรัพย์รวบรวมข้อมูลราคาสำหรับบ้าน 100 หลังในเมืองของเขา และพบว่าส่วนเบี่ยงเบนมาตรฐานของราคาคือ 12,000 ดอลลาร์
สถานการณ์ที่ 2 : นักเศรษฐศาสตร์วัดภาษีเงินได้ทั้งหมดที่จัดเก็บใน 50 รัฐของสหรัฐอเมริกา และพบว่าค่าเบี่ยงเบนมาตรฐานของภาษีเงินได้ทั้งหมดที่รวบรวมได้คือ 480,000 ดอลลาร์
แม้ว่าค่าเบี่ยงเบนมาตรฐานของสถานการณ์ที่ 2 จะสูงกว่าค่าเบี่ยงเบนมาตรฐานของสถานการณ์ที่ 1 มาก แต่หน่วยที่วัดได้ในสถานการณ์ที่ 2 นั้นสูงกว่ามาก เนื่องจากภาษีทั้งหมดที่รัฐจัดเก็บไว้นั้นสูงกว่าราคาอสังหาริมทรัพย์อย่างเห็นได้ชัด
ซึ่งหมายความว่าไม่มีตัวเลขตัวเดียวที่เราสามารถใช้เพื่อระบุได้ว่าค่าเบี่ยงเบนมาตรฐานคือ “ดี” หรือ “ไม่ดี” หรือแม้กระทั่ง “สูง” หรือ “ต่ำ” เนื่องจากขึ้นอยู่กับสถานการณ์
ใช้สัมประสิทธิ์ของการแปรผัน
วิธีหนึ่งในการพิจารณาว่าค่าเบี่ยงเบนมาตรฐานสูงหรือไม่คือการเปรียบเทียบกับค่าเฉลี่ยของชุดข้อมูล
ค่าสัมประสิทธิ์การแปรผัน ซึ่งมักเรียกสั้น ๆ ว่า CV เป็นวิธีการวัดการแพร่กระจายของค่าในชุดข้อมูลที่สัมพันธ์กับค่าเฉลี่ย มีการคำนวณดังนี้:
CV = ส/ x
ทอง:
- s: ค่าเบี่ยงเบนมาตรฐานของชุดข้อมูล
- x : ค่าเฉลี่ยของชุดข้อมูล
พูดง่ายๆ ก็คือ CV คืออัตราส่วนของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ย
ยิ่ง CV สูง ค่าเบี่ยงเบนมาตรฐาน จาก ค่าเฉลี่ยก็จะยิ่งสูงขึ้น โดยทั่วไปแล้ว ค่า CV ที่มากกว่า 1 มักจะถือว่าสูง
ตัวอย่างเช่น สมมติว่าตัวแทนอสังหาริมทรัพย์รวบรวมข้อมูลราคาบ้าน 100 หลังในเมืองของเธอ และพบว่าราคาเฉลี่ยอยู่ที่ 150,000 ดอลลาร์ และส่วนเบี่ยงเบนมาตรฐานของราคาคือ 12,000 ดอลลาร์ CV จะถูกคำนวณดังนี้:
- ประวัติย่อ: $12,000 / $150,000 = 0.08
เนื่องจากค่า CV นี้น้อยกว่า 1 มาก จึงบอกเราว่าค่าเบี่ยงเบนมาตรฐานของข้อมูลค่อนข้างต่ำ
ในทางกลับกัน สมมติว่านักเศรษฐศาสตร์วัดภาษีเงินได้ทั้งหมดที่รวบรวมได้ใน 50 รัฐของสหรัฐอเมริกา และพบว่าค่าเฉลี่ยตัวอย่างคือ 400,000 ดอลลาร์ และส่วนเบี่ยงเบนมาตรฐานคือ 480,000 ดอลลาร์ CV จะถูกคำนวณดังนี้:
- ประวัติย่อ: 480,000 เหรียญสหรัฐฯ / 400,000 เหรียญสหรัฐฯ = 1.2
เนื่องจากค่า CV นี้มากกว่า 1 จึงบอกเราว่าค่าเบี่ยงเบนมาตรฐานของค่าข้อมูลค่อนข้างสูง
การเปรียบเทียบค่าเบี่ยงเบนมาตรฐานระหว่างชุดข้อมูล
เรามักจะใช้ค่าเบี่ยงเบนมาตรฐานในการวัดการกระจายของค่าในชุดข้อมูลต่างๆ
ตัวอย่างเช่น สมมติว่าศาสตราจารย์ให้ข้อสอบนักเรียนสามครั้งตลอดภาคการศึกษา จากนั้นจะคำนวณค่าเบี่ยงเบนมาตรฐานของคะแนนสำหรับการสอบแต่ละครั้ง:
- ตัวอย่างค่าเบี่ยงเบนมาตรฐานของผลสอบ 1: 4.6
- ตัวอย่างค่าเบี่ยงเบนมาตรฐานของผลสอบ 2: 12.4
- ตัวอย่างค่าเบี่ยงเบนมาตรฐานของผลการสอบ 3: 2.3
ข้อความนี้บอกอาจารย์ว่าผลการสอบจะกระจัดกระจายมากที่สุดสำหรับการสอบครั้งที่ 2 ในขณะที่ผลลัพธ์จะกระจัดกระจายมากที่สุดสำหรับการสอบครั้งที่ 3
แหล่งข้อมูลเพิ่มเติม
ค่าเบี่ยงเบนมาตรฐานและข้อผิดพลาดมาตรฐาน: อะไรคือความแตกต่าง?
ค่าเบี่ยงเบนมาตรฐานกับพิสัยระหว่างควอไทล์: อะไรคือความแตกต่าง?