เหตุใดค่าเบี่ยงเบนมาตรฐานจึงมีความสำคัญ (คำอธิบาย + ตัวอย่าง)
ค่าเบี่ยงเบนมาตรฐาน ใช้ในการวัดการกระจายของค่าในตัวอย่าง
เราสามารถใช้สูตรต่อไปนี้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างที่กำหนด:
√ Σ(x ผม – x บาร์ ) 2 / (n-1)
ทอง:
- Σ: สัญลักษณ์ที่หมายถึง “ผลรวม”
- x i : ค่า i ของกลุ่มตัวอย่าง
- x bar : หมายถึงตัวอย่าง
- n: ขนาดตัวอย่าง
ยิ่งค่าเบี่ยงเบนมาตรฐานสูง ค่าในตัวอย่างก็จะยิ่งกระจัดกระจายมากขึ้น ในทางกลับกัน ยิ่งค่าเบี่ยงเบนมาตรฐานยิ่งต่ำ ค่าต่างๆ จะถูกจัดกลุ่มให้ใกล้เคียงกันมากขึ้น
คำถามที่นักเรียนมักถามคือ ทำไมค่าเบี่ยงเบนมาตรฐานจึงสำคัญ
คำตอบ: ค่าเบี่ยงเบนมาตรฐานมีความสำคัญเนื่องจากบอกเราถึงการกระจายของค่าในชุดข้อมูลที่กำหนด
เราวิเคราะห์ชุดข้อมูล เมื่อใดก็ตามที่เราต้องการค้นหาตัวชี้วัดต่อไปนี้:
- ศูนย์กลางของชุดข้อมูล วิธีที่ใช้กันทั่วไปในการวัด “ศูนย์กลาง” คือการใช้ค่าเฉลี่ยและค่ามัธยฐาน
- การกระจายค่าในชุดข้อมูล วิธีที่ใช้กันทั่วไปในการวัดค่าสเปรดคือการใช้ค่าเบี่ยงเบนมาตรฐาน
เมื่อรู้ว่าจุดศูนย์กลางอยู่ที่ไหนและการกระจายของค่าคืออะไร เราก็สามารถเข้าใจการกระจายของค่าในชุดข้อมูลใดๆ ได้เป็นอย่างดี
ตัวอย่างต่อไปนี้แสดงให้เห็นถึงความสำคัญของค่าเบี่ยงเบนมาตรฐานในทางปฏิบัติ
ตัวอย่างที่ 1: การกระจายเงินเดือน
สมมติว่าเงินเดือนโดยเฉลี่ยของบริษัท A อยู่ที่ 80,000 เหรียญสหรัฐฯ และส่วนเบี่ยงเบนมาตรฐานคือ 20,000 เหรียญสหรัฐฯ เนื่องจากค่าเบี่ยงเบนมาตรฐานนั้นสูงมาก จึงไม่รับประกันว่าคุณจะได้รับเงินเกือบ 80,000 ดอลลาร์ต่อปีหากคุณทำงานที่บริษัทนี้ เนื่องจากเงินเดือนมีการเปลี่ยนแปลงดังกล่าว
ในทางกลับกัน สมมติว่าเงินเดือนโดยเฉลี่ยของบริษัท B อยู่ที่ 80,000 เหรียญสหรัฐฯ เช่นกัน แต่ค่าเบี่ยงเบนมาตรฐานอยู่ที่ 4,000 เหรียญสหรัฐฯ เท่านั้น เนื่องจากค่าเบี่ยงเบนมาตรฐานนี้น้อยมาก คุณจึงมั่นใจได้ว่าคุณจะได้รับเงินเกือบ 80,000 ดอลลาร์สหรัฐฯ เนื่องจากเงินเดือนมีการเปลี่ยนแปลงน้อยมาก
หากเราสร้าง Boxplot เพื่อแสดงภาพการกระจายเงินเดือนของทั้งสองบริษัท อาจมีลักษณะดังนี้:

โปรดทราบว่าความยาวของบ็อกซ์พล็อตสำหรับบริษัท A จะมากกว่าเนื่องจากค่าเบี่ยงเบนมาตรฐานของค่าจ้างจะสูงกว่ามาก
ทั้งสองบริษัทมีเงินเดือนโดยเฉลี่ยเท่ากัน แต่บริษัท A มีช่องว่างเงินเดือนสูงกว่ามาก
ตัวอย่างที่ 2: การกระจายราคาที่อยู่อาศัย
สมมติว่าราคาที่อยู่อาศัยเฉลี่ยในละแวก A คือ 250,000 ดอลลาร์ และส่วนเบี่ยงเบนมาตรฐานคือ 50,000 ดอลลาร์ เนื่องจากค่าเบี่ยงเบนมาตรฐานค่อนข้างสูง ซึ่งหมายความว่าราคาบ้านบางหลังจะสูงกว่า 250,000 ดอลลาร์สหรัฐฯ มาก และบางราคาจะต่ำกว่ามาก หากคุณดูบ้านใดๆ ในละแวกนี้ ไม่มีการรับประกันว่าราคาจะอยู่ใกล้ค่าเฉลี่ย
ในทางกลับกัน สมมติว่าราคาบ้านเฉลี่ยในละแวก B อยู่ที่ 250,000 เหรียญสหรัฐฯ เช่นกัน แต่ค่าเบี่ยงเบนมาตรฐานอยู่ที่ 10,000 เหรียญสหรัฐฯ เท่านั้น เนื่องจากค่าเบี่ยงเบนมาตรฐานนี้ค่อนข้างน้อย คุณจึงมั่นใจได้ว่าบ้านทุกหลังที่คุณดูในละแวกใกล้เคียงมีแนวโน้มที่จะปิดราคานี้
หากเราสร้าง boxplot เพื่อให้เห็นภาพการกระจายตัวของราคาบ้านในละแวกใกล้เคียงทั้งสองนี้ อาจมีลักษณะดังนี้:

ความยาวของบ็อกซ์พล็อตของย่าน A นั้นยาวกว่าเนื่องจากค่าเบี่ยงเบนมาตรฐานของราคาอสังหาริมทรัพย์นั้นสูงกว่ามาก
ในความเป็นจริง ราคาที่อยู่อาศัยมีตั้งแต่น้อยกว่า $150,000 ถึงมากกว่า $400,000 สำหรับย่าน A ในขณะที่ราคาอยู่ระหว่างประมาณ $230,000 ถึง $270,000 สำหรับย่าน B.
เพียงทราบค่าเบี่ยงเบนมาตรฐานของราคาบ้านในแต่ละละแวกบ้าน เราก็จะทราบได้ว่าราคาในแต่ละละแวกบ้านจะมีความผันแปรมากน้อยเพียงใด
แหล่งข้อมูลเพิ่มเติม
สิ่งที่ถือว่าเป็นค่าเบี่ยงเบนมาตรฐานที่ดี?
ช่วงเทียบกับ ค่าเบี่ยงเบนมาตรฐาน: เมื่อใดควรใช้แต่ละรายการ
สัมประสิทธิ์ของการแปรผันกับส่วนเบี่ยงเบนมาตรฐาน: ความแตกต่าง