วิธีการระบุความไม่สมมาตรในแปลงกล่อง


พล็อตกล่อง คือประเภทของพล็อตที่แสดงข้อมูลสรุปห้าหลักของชุดข้อมูล ซึ่งประกอบด้วย:

  • ค่าต่ำสุด
  • ควอร์ไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25)
  • ค่ามัธยฐาน
  • ควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75)
  • ค่าสูงสุด

เราใช้กระบวนการต่อไปนี้เพื่อวาดกล่องพล็อต:

  • วาดกล่องจากควอไทล์ที่หนึ่ง (Q1) ถึงควอร์ไทล์ที่สาม (Q3)
  • จากนั้นลากเส้นภายในช่องตรงกลาง
  • จากนั้นวาด “หนวด” ของควอไทล์ให้เป็นค่าต่ำสุดและสูงสุด

เราสามารถระบุได้ว่าการแจกแจงมีความเบ้หรือไม่โดยขึ้นอยู่กับว่าค่ามัธยฐานอยู่ในบ็อกซ์พล็อตอยู่ที่ใด

ความไม่สมมาตรของโครงกล่อง

เมื่อค่ามัธยฐานอยู่ใกล้กับด้านล่างของกล่องมากขึ้น และหนวดเคราสั้นกว่าที่ปลายล่างของกล่อง การกระจายจะเอียงไปทางขวา (หรือเอียง “เชิงบวก”)

เมื่อค่ามัธยฐานอยู่ใกล้กับด้านบนของกล่องมากขึ้น และหนวดเคราสั้นกว่าที่ปลายด้านบนของกล่อง การกระจายจะเอียงไปทางซ้าย (หรือเอียง “เชิงลบ”)

เมื่อค่ามัธยฐานอยู่ตรงกลางกล่องและหนวดทั้งสองข้างเท่ากันโดยประมาณ การกระจายตัวจะสมมาตร (หรือ “ไม่” ไม่สมมาตร)

ตัวอย่างต่อไปนี้แสดงวิธีใช้ boxplots เพื่อพิจารณาว่าการแจกแจงเอียงขวา เอียงซ้าย หรือไม่เอียง

ตัวอย่างที่ 1: การแจกแจงแบบเบ้ขวา

การกระจายรายได้ต่อปีของครัวเรือนในสหรัฐอเมริกามีการบิดเบือนไปทางขวา ครัวเรือนส่วนใหญ่มีรายได้ระหว่าง 40,000 ถึง 80,000 เหรียญสหรัฐฯ ต่อปี แต่มีหางขวายาวในการกระจายซึ่งแสดงถึงครัวเรือนที่มีรายได้มากกว่ามาก

หากเราสร้าง Box Plot เพื่อให้เห็นภาพการกระจายรายได้ของครัวเรือน จะมีลักษณะดังนี้:

โปรดทราบว่าเส้นแนวตั้งภายในกล่องที่แสดงถึงค่ามัธยฐานจะอยู่ใกล้กับควอไทล์ที่ 1 มากกว่าควอร์ไทล์ที่ 3 มาก ซึ่งหมายความว่าการกระจายตัวจะเอียงไปทางขวา

ตัวอย่างที่ 2: การแจกแจงแบบเบ้ซ้าย

การกระจายอายุของการเสียชีวิตในประชากรส่วนใหญ่เบ้ไปทางซ้าย คนส่วนใหญ่มีอายุระหว่าง 70 ถึง 80 ปี และมีคนอายุต่ำกว่านี้น้อยลงเรื่อยๆ

หากเราสร้างกล่องพล็อตเพื่อให้เห็นภาพการแจกแจงอายุของการเสียชีวิต จะมีลักษณะดังนี้:

โปรดทราบว่าเส้นแนวตั้งภายในกล่องที่แสดงถึงค่ามัธยฐานนั้นอยู่ใกล้กับควอไทล์ที่ 3 มากกว่าควอร์ไทล์ที่ 1 มาก ซึ่งหมายความว่าการกระจายตัวจะเบ้ไปทางซ้าย

ตัวอย่างที่ 3: การกระจายแบบสมมาตร

การกระจายขนาดของตัวผู้มี ความสมมาตร โดยประมาณ และไม่แสดงความไม่สมมาตร ตัวอย่างเช่น ความสูงเฉลี่ยของผู้ชายในสหรัฐอเมริกาคือประมาณ 69.1 นิ้ว การกระจายความสูงมีความสมมาตรโดยประมาณ โดยบางส่วนสั้นกว่าและสูงกว่า

หากเราสร้างแผนภูมิกล่องเพื่อให้เห็นภาพการกระจายตัวของส่วนสูงของผู้ชายในสหรัฐอเมริกา จะมีลักษณะดังนี้:

โปรดทราบว่าเส้นแนวตั้งภายในกล่องที่แสดงถึงค่ามัธยฐานจะอยู่ใกล้กับควอไทล์ที่ 1 และควอไทล์ที่ 3 เช่นกัน ซึ่งหมายความว่าการกระจายตัวมีความสมมาตรและไม่มีความเบ้

แหล่งข้อมูลเพิ่มเติม

การแจกแจงเบ้ซ้ายหรือขวา
วิธีเปรียบเทียบแปลงกล่อง: พร้อมตัวอย่าง
วิธีการสร้างแปลงกล่องแบบเคียงข้างกันใน Excel

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *