ช่วงระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐาน: อะไรคือความแตกต่าง?
ช่วงระหว่างควอไทล์ และ ส่วนเบี่ยงเบนมาตรฐาน เป็นสองวิธีในการวัดการกระจายของค่าในชุดข้อมูล
บทช่วยสอนนี้จะอธิบายโดยย่อเกี่ยวกับแต่ละเมตริก พร้อมทั้งความเหมือนและความแตกต่างระหว่างทั้งสอง
พิสัยระหว่างควอไทล์
ช่วงระหว่างควอไทล์ (IQR) ของชุดข้อมูลคือความแตกต่างระหว่างควอไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25) และควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) โดยจะวัดการกระจายของค่าเฉลี่ย 50% ของค่า
ไอคิวอาร์ = ไตรมาส 3 – ไตรมาส 1
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้:
ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
จากเครื่องคำนวณช่วงระหว่างควอไทล์ ช่วงระหว่างควอไทล์ (IQR) สำหรับชุดข้อมูลนี้คำนวณได้ดังนี้
- T1: 12
- T3: 26.5
- ไอคิวอาร์ = ไตรมาส 3 – ไตรมาส 1 = 14.5
สิ่งนี้บอกเราว่าค่ากลาง 50% ในชุดข้อมูลมีค่าเบี่ยงเบน 14.5 .
ส่วนเบี่ยงเบนมาตรฐาน
ค่า เบี่ยงเบนมาตรฐาน ของชุดข้อมูลเป็นวิธีการวัดค่าเบี่ยงเบนทั่วไปของแต่ละค่าจากค่าเฉลี่ย มีการคำนวณดังนี้:
s = √(Σ(x i – x ) 2 / (n-1))
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้:
ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
เราสามารถใช้เครื่องคิดเลขเพื่อหาว่าค่าเบี่ยงเบนมาตรฐานของชุดข้อมูลนี้คือ 9.25 สิ่งนี้ทำให้เราทราบได้ว่าค่าทั่วไปอยู่ห่างจากค่าเฉลี่ยมากเพียงใด
ความเหมือนและความแตกต่าง
พิสัยระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐานมี ความคล้ายคลึงกันดังต่อไปนี้:
- ตัวชี้วัดทั้งสองวัดการกระจายของค่าในชุดข้อมูล
อย่างไรก็ตาม ช่วงระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐานมี ความแตกต่างที่สำคัญดังต่อไปนี้:
- ช่วงระหว่างควอไทล์ (IQR) ไม่ได้รับผลกระทบจากค่าผิดปกติที่รุนแรง เช่น ค่าที่น้อยมากหรือมากในชุดข้อมูลจะไม่ส่งผลต่อการคำนวณ IQR เนื่องจาก IQR จะใช้ค่าเปอร์เซ็นไทล์ที่ 25 และค่าเปอร์เซ็นไทล์ที่ 75 ของชุดข้อมูลเท่านั้น
- ค่าเบี่ยงเบนมาตรฐาน ได้ รับผลกระทบจากค่าผิดปกติที่รุนแรง ตัวอย่างเช่น ค่าที่มีขนาดใหญ่มากในชุดข้อมูลจะส่งผลให้ค่าเบี่ยงเบนมาตรฐานมีขนาดใหญ่ขึ้นมาก เนื่องจากค่าเบี่ยงเบนมาตรฐานจะใช้ทุกค่าในชุดข้อมูลในสูตรของมัน
เมื่อใดจึงจะใช้แต่ละอย่าง
คุณควรใช้ช่วงอินเทอร์ควอไทล์เพื่อวัดการกระจายของค่าในชุดข้อมูลเมื่อมีค่าผิดปกติมาก
ในทางกลับกัน คุณควรใช้ค่าเบี่ยงเบนมาตรฐานในการวัดการกระจายของค่าเมื่อไม่มีค่าผิดปกติที่รุนแรง
เพื่ออธิบายสาเหตุ ให้พิจารณาชุดข้อมูลต่อไปนี้:
ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
ในช่วงต้นของบทความ เราได้คำนวณเมตริกต่อไปนี้สำหรับชุดข้อมูลนี้:
- ไอคิวอาร์: 14.5
- ส่วนเบี่ยงเบนมาตรฐาน: 9.25
อย่างไรก็ตาม ให้พิจารณาว่าชุดข้อมูลมีค่าผิดปกติมากหรือไม่:
ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
เราสามารถใช้เครื่องคิดเลขเพื่อค้นหาหน่วยเมตริกต่อไปนี้สำหรับชุดข้อมูลนี้:
- ไอคิวอาร์: 15
- ส่วนเบี่ยงเบนมาตรฐาน: 85.02
โปรดทราบว่าช่วงระหว่างควอร์ไทล์แทบจะไม่เปลี่ยนแปลงเมื่อมีค่าผิดปกติ ในขณะที่ค่าเบี่ยงเบนมาตรฐานเพิ่มขึ้นจาก 9.25 เป็น 85.02
แหล่งข้อมูลเพิ่มเติม
การวัดแนวโน้มส่วนกลาง: คำจำกัดความและตัวอย่าง
มาตรการการกระจายตัว: คำจำกัดความและตัวอย่าง
วิธีค้นหาค่าผิดปกติโดยใช้พิสัยระหว่างควอไทล์