ช่วงระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐาน: อะไรคือความแตกต่าง?


ช่วงระหว่างควอไทล์ และ ส่วนเบี่ยงเบนมาตรฐาน เป็นสองวิธีในการวัดการกระจายของค่าในชุดข้อมูล

บทช่วยสอนนี้จะอธิบายโดยย่อเกี่ยวกับแต่ละเมตริก พร้อมทั้งความเหมือนและความแตกต่างระหว่างทั้งสอง

พิสัยระหว่างควอไทล์

ช่วงระหว่างควอไทล์ (IQR) ของชุดข้อมูลคือความแตกต่างระหว่างควอไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25) และควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) โดยจะวัดการกระจายของค่าเฉลี่ย 50% ของค่า

ไอคิวอาร์ = ไตรมาส 3 – ไตรมาส 1

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

จากเครื่องคำนวณช่วงระหว่างควอไทล์ ช่วงระหว่างควอไทล์ (IQR) สำหรับชุดข้อมูลนี้คำนวณได้ดังนี้

  • T1: 12
  • T3: 26.5
  • ไอคิวอาร์ = ไตรมาส 3 – ไตรมาส 1 = 14.5

สิ่งนี้บอกเราว่าค่ากลาง 50% ในชุดข้อมูลมีค่าเบี่ยงเบน 14.5 .

ส่วนเบี่ยงเบนมาตรฐาน

ค่า เบี่ยงเบนมาตรฐาน ของชุดข้อมูลเป็นวิธีการวัดค่าเบี่ยงเบนทั่วไปของแต่ละค่าจากค่าเฉลี่ย มีการคำนวณดังนี้:

s = √(Σ(x ix ) 2 / (n-1))

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

เราสามารถใช้เครื่องคิดเลขเพื่อหาว่าค่าเบี่ยงเบนมาตรฐานของชุดข้อมูลนี้คือ 9.25 สิ่งนี้ทำให้เราทราบได้ว่าค่าทั่วไปอยู่ห่างจากค่าเฉลี่ยมากเพียงใด

ความเหมือนและความแตกต่าง

พิสัยระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐานมี ความคล้ายคลึงกันดังต่อไปนี้:

  • ตัวชี้วัดทั้งสองวัดการกระจายของค่าในชุดข้อมูล

อย่างไรก็ตาม ช่วงระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐานมี ความแตกต่างที่สำคัญดังต่อไปนี้:

  • ช่วงระหว่างควอไทล์ (IQR) ไม่ได้รับผลกระทบจากค่าผิดปกติที่รุนแรง เช่น ค่าที่น้อยมากหรือมากในชุดข้อมูลจะไม่ส่งผลต่อการคำนวณ IQR เนื่องจาก IQR จะใช้ค่าเปอร์เซ็นไทล์ที่ 25 และค่าเปอร์เซ็นไทล์ที่ 75 ของชุดข้อมูลเท่านั้น
  • ค่าเบี่ยงเบนมาตรฐาน ได้ รับผลกระทบจากค่าผิดปกติที่รุนแรง ตัวอย่างเช่น ค่าที่มีขนาดใหญ่มากในชุดข้อมูลจะส่งผลให้ค่าเบี่ยงเบนมาตรฐานมีขนาดใหญ่ขึ้นมาก เนื่องจากค่าเบี่ยงเบนมาตรฐานจะใช้ทุกค่าในชุดข้อมูลในสูตรของมัน

เมื่อใดจึงจะใช้แต่ละอย่าง

คุณควรใช้ช่วงอินเทอร์ควอไทล์เพื่อวัดการกระจายของค่าในชุดข้อมูลเมื่อมีค่าผิดปกติมาก

ในทางกลับกัน คุณควรใช้ค่าเบี่ยงเบนมาตรฐานในการวัดการกระจายของค่าเมื่อไม่มีค่าผิดปกติที่รุนแรง

เพื่ออธิบายสาเหตุ ให้พิจารณาชุดข้อมูลต่อไปนี้:

ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

ในช่วงต้นของบทความ เราได้คำนวณเมตริกต่อไปนี้สำหรับชุดข้อมูลนี้:

  • ไอคิวอาร์: 14.5
  • ส่วนเบี่ยงเบนมาตรฐาน: 9.25

อย่างไรก็ตาม ให้พิจารณาว่าชุดข้อมูลมีค่าผิดปกติมากหรือไม่:

ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

เราสามารถใช้เครื่องคิดเลขเพื่อค้นหาหน่วยเมตริกต่อไปนี้สำหรับชุดข้อมูลนี้:

  • ไอคิวอาร์: 15
  • ส่วนเบี่ยงเบนมาตรฐาน: 85.02

โปรดทราบว่าช่วงระหว่างควอร์ไทล์แทบจะไม่เปลี่ยนแปลงเมื่อมีค่าผิดปกติ ในขณะที่ค่าเบี่ยงเบนมาตรฐานเพิ่มขึ้นจาก 9.25 เป็น 85.02

แหล่งข้อมูลเพิ่มเติม

การวัดแนวโน้มส่วนกลาง: คำจำกัดความและตัวอย่าง
มาตรการการกระจายตัว: คำจำกัดความและตัวอย่าง
วิธีค้นหาค่าผิดปกติโดยใช้พิสัยระหว่างควอไทล์

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *