วิธีการตีความช่วงระหว่างควอไทล์: พร้อมตัวอย่าง
ช่วงระหว่างควอไทล์ ของชุดข้อมูล ซึ่งมักเรียกสั้น ๆ ว่า IQR คือความแตกต่างระหว่างควอร์ไทล์ที่ 1 (เปอร์เซ็นไทล์ที่ 25) และควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) ของชุดข้อมูล
พูดง่ายๆ ก็คือ วัดค่าเบี่ยงเบนระหว่างค่ากลาง 50%
ไอคิวอาร์ = ไตรมาส 3 – ไตรมาส 1
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่แสดงความสูงของต้นที่แตกต่างกัน 17 ต้น (หน่วยเป็นนิ้ว) ในห้องปฏิบัติการ:
ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
จากเครื่องคำนวณช่วงระหว่างควอไทล์ ช่วงระหว่างควอไทล์ (IQR) สำหรับชุดข้อมูลนี้คำนวณได้ดังนี้
- T1: 12
- T3: 26.5
- ไอคิวอาร์ = ไตรมาส 3 – ไตรมาส 1 = 14.5
สิ่งนี้บอกเราว่าค่ากลาง 50% ในชุดข้อมูลมีสเปรด 14.5 นิ้ว
เหตุใดพิสัยระหว่างควอไทล์จึงมีประโยชน์
ช่วงระหว่างควอไทล์เป็นวิธีหนึ่งในการวัดการกระจายของค่าในชุดข้อมูล แต่มีการวัดการกระจายแบบอื่น เช่น
- ช่วง: วัดความแตกต่างระหว่างค่าต่ำสุดและค่าสูงสุดในชุดข้อมูล
- ค่าเบี่ยงเบนมาตรฐาน: วัดค่าเบี่ยงเบนทั่วไปของแต่ละค่าจากค่าเฉลี่ยในชุดข้อมูล
ข้อดีของการใช้ช่วงระหว่างควอไทล์ (IQR) เพื่อวัดการกระจายของค่าในชุดข้อมูลก็คือ ไม่ได้รับผลกระทบจากค่าผิดปกติที่รุนแรง
เช่น ค่าที่น้อยมากหรือมากในชุดข้อมูลจะไม่ส่งผลต่อการคำนวณ IQR เนื่องจาก IQR จะใช้ค่าเปอร์เซ็นไทล์ที่ 25 และค่าเปอร์เซ็นไทล์ที่ 75 ของชุดข้อมูลเท่านั้น
เพื่อแสดงให้เห็นสิ่งนี้ ให้พิจารณาชุดข้อมูลต่อไปนี้:
ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
ชุดข้อมูลนี้มีการวัดการแพร่กระจายดังต่อไปนี้
- ไอคิวอาร์: 14.5
- ส่วนเบี่ยงเบนมาตรฐาน: 9.25
- ระยะ: 31
อย่างไรก็ตาม ให้พิจารณาว่าชุดข้อมูลมีค่าผิดปกติมากหรือไม่:
ชุดข้อมูล: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
เราสามารถใช้เครื่องคิดเลขเพื่อค้นหาการวัดค่าสเปรดต่อไปนี้สำหรับชุดข้อมูลนี้:
- ไอคิวอาร์: 15
- ส่วนเบี่ยงเบนมาตรฐาน: 85.02
- ระยะ: 377
โปรดทราบว่าช่วงระหว่างควอร์ไทล์แทบจะไม่เปลี่ยนแปลงเมื่อมีค่าผิดปกติ ในขณะที่ค่าเบี่ยงเบนมาตรฐานและช่วงเปลี่ยนแปลงอย่างมาก
การเปรียบเทียบช่วงระหว่างควอไทล์ระหว่างชุดข้อมูล
ช่วงระหว่างควอไทล์ยังสามารถใช้เพื่อเปรียบเทียบการกระจายของค่าระหว่างชุดข้อมูลต่างๆ
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลสามชุดที่มีค่า IQR ต่อไปนี้:
- IQR ของชุดข้อมูล 1: 13.5
- IQR ของชุดข้อมูล 2: 24.4
- ชุดข้อมูล 3 IQR: 8.7
สิ่งนี้บอกเราว่าช่องว่างระหว่างค่ากลาง 50% นั้นใหญ่ที่สุดสำหรับชุดข้อมูล 2 และเล็กที่สุดสำหรับชุดข้อมูล 3
แหล่งข้อมูลเพิ่มเติม
วิธีการคำนวณช่วงระหว่างควอไทล์ใน Excel
วิธีคำนวณพิสัยระหว่างควอไทล์ใน Python
วิธีค้นหาค่าผิดปกติโดยใช้พิสัยระหว่างควอไทล์
เครื่องคำนวณช่วงระหว่างควอไทล์