วิธีเปรียบเทียบแปลงกล่อง: พร้อมตัวอย่าง


พล็อตกล่อง คือประเภทของพล็อตที่แสดงข้อมูลสรุปห้าหลักของชุดข้อมูล ซึ่งประกอบด้วย:

  • ค่าต่ำสุด
  • ควอร์ไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25)
  • ค่ามัธยฐาน
  • ควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75)
  • ค่าสูงสุด

ในการสร้างพล็อตกล่อง เราจะวาดกล่องจากควอไทล์ที่หนึ่งถึงควอไทล์ที่สาม ต่อไปเราวาดเส้นแนวตั้งที่ค่ามัธยฐาน สุดท้าย เราวาด “หนวด” ของควอไทล์จนถึงค่าต่ำสุดและสูงสุด

Boxplots มีประโยชน์เพราะช่วยให้เราเข้าใจการกระจายของค่าในชุดข้อมูลได้อย่างรวดเร็ว นอกจากนี้ยังมีประโยชน์สำหรับการเปรียบเทียบชุดข้อมูลสองชุดที่แตกต่างกันอีกด้วย

เมื่อเปรียบเทียบบ็อกซ์พล็อตสองรายการขึ้นไป เราสามารถตอบคำถามที่แตกต่างกันได้สี่ข้อ:

1. ค่ามัธยฐานเปรียบเทียบกันอย่างไร? เราสามารถเปรียบเทียบเส้นแนวตั้งในแต่ละช่องเพื่อดูว่าชุดข้อมูลใดมีค่ามัธยฐานที่สูงกว่า

2. การกระจายตัวเปรียบเทียบกันอย่างไร? เราสามารถเปรียบเทียบความยาวของแต่ละกล่อง (ซึ่งแสดงถึงระยะห่างระหว่าง Q1 และ Q3 ซึ่งเป็นช่วงระหว่างควอไทล์) เพื่อพิจารณาว่าชุดข้อมูลใดมีขนาดใหญ่กว่า

3. ความไม่สมมาตรเปรียบเทียบกันอย่างไร? ยิ่งเส้นแนวตั้งอยู่ใกล้กับไตรมาสแรกมากเท่าใด ชุดข้อมูลก็จะยิ่งบิดเบือนไปในทางบวกมากขึ้นเท่านั้น ยิ่งเส้นแนวตั้งอยู่ใกล้ไตรมาสที่สาม ชุดข้อมูลก็จะยิ่งบิดเบี้ยวมากขึ้น

4. มีค่าผิดปกติอยู่หรือไม่? ในแปลงกล่อง ค่าผิดปกติมักจะแสดงด้วยวงกลมเล็กๆ ที่ขยายออกไปเกินแต่ละหนวด การสังเกตถูกกำหนดให้เป็นค่าผิดปกติหากตรงตามเกณฑ์ข้อใดข้อหนึ่งต่อไปนี้:

  • การสังเกตอย่างหนึ่งมีค่าน้อยกว่า Q1 – 1.5*IQR
  • การสังเกตมีค่ามากกว่า Q3 + 1.5*IQR

ตัวอย่างต่อไปนี้แสดงวิธีเปรียบเทียบ Boxplots สองรายการที่แตกต่างกันและตอบคำถามสี่ข้อนี้

ตัวอย่าง: การเปรียบเทียบแปลงกล่อง

ชุดข้อมูลต่อไปนี้แสดงผลของนักเรียนที่ใช้เทคนิคการศึกษาแบบใดแบบหนึ่งจากสองเทคนิคเพื่อเตรียมตัวสำหรับการสอบ:

วิธีที่ 1: 78, 78, 79, 80, 80, 82, 82, 83, 83, 86, 86, 86, 86, 87, 87, 87, 88, 88, 88, 91

วิธีที่ 2: 66, 66, 66, 67, 68, 70, 72, 75, 75, 78, 82, 83, 86, 88, 89, 90, 93, 94, 95, 98

หากเราสร้าง boxplots สำหรับแต่ละชุดข้อมูล มันจะเป็นดังนี้:

ตัวอย่างการเปรียบเทียบ Box Plot

เราสามารถเปรียบเทียบ boxplots ทั้งสองนี้และตอบคำถามสี่ข้อต่อไปนี้:

1. ค่ามัธยฐานเปรียบเทียบกันอย่างไร? เส้นตรงกลางกล่องแปลงสำหรับวิธีเรียนที่ 1 สูงกว่าเส้นสำหรับเรียนวิธีที่ 2 แสดงว่านักเรียนที่ใช้วิธีเรียนแบบที่ 1 มีเกรดเฉลี่ยในการสอบที่สูงขึ้น

2. การกระจายตัวเปรียบเทียบกันอย่างไร? โครงเรื่องสำหรับวิธีเรียนที่ 2 ยาวกว่าวิธีเรียนแบบที่ 1 มาก ซึ่งบ่งชี้ว่าคะแนนสอบมีการกระจายในหมู่นักเรียนที่ใช้วิธีการเรียนแบบที่ 2 มากกว่ามาก

3. ความไม่สมมาตรเปรียบเทียบกันอย่างไร? เส้นตรงกลางกล่องพล็อตสำหรับวิธีเรียนที่ 1 ใกล้เคียงกับไตรมาสที่ 3 แสดงว่าการกระจายคะแนนสอบของนักเรียนที่ใช้วิธีเรียนที่ 1 เบี่ยงเบนไปในเชิงลบ ในทางกลับกัน เส้นตรงกลางกล่องพล็อตสำหรับวิธีที่ 2 ศึกษาจะอยู่ใกล้กับกึ่งกลางกล่อง ซึ่งหมายความว่าการกระจายตัวของคะแนนจะเอียงน้อยที่สุด

4. มีค่าผิดปกติอยู่หรือไม่? Boxplot ไม่มีวงกลมเล็กๆ ที่ขยายเกินขอบด้านบนหรือด้านล่าง ซึ่งหมายความว่าชุดข้อมูลทั้งสองไม่มีค่าผิดปกติที่ชัดเจน

แหล่งข้อมูลเพิ่มเติม

วิธีสร้างและตีความแปลงกล่องใน Excel
วิธีสร้างและตีความ Box Plots ใน SPSS
วิธีสร้างแปลงหลายกล่องใน R
วิธีสร้างและตีความ Box Plots ใน Stata

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *