كيفية قراءة مؤامرة مربعة مع القيم المتطرفة (مع مثال)


المخطط الصندوقي هو نوع من المخطط يعرض ملخصًا مكونًا من خمسة أرقام لمجموعة بيانات، والذي يتضمن:

  • الحد الأدنى للقيمة
  • الربع الأول (المئوية الخامسة والعشرون)
  • القيمة المتوسطة
  • الربع الثالث (المئوي 75)
  • القيمة القصوى

لرسم مخطط مربع، نرسم أولًا مربعًا من الربع الأول إلى الربع الثالث.

بعد ذلك، نرسم خطًا رأسيًا في المنتصف.

وأخيرًا، نرسم “شوارب” الربعيات حتى القيمة الدنيا والقصوى.

في معظم البرامج الإحصائية، يتم تعريف الملاحظة على أنها قيمة متطرفة إذا استوفت أحد الشرطين التاليين:

  • الملاحظة هي 1.5 مرة النطاق الربيعي تحت الربع الأول (Q1)
  • الملاحظة هي 1.5 مرة النطاق الربيعي فوق الربع الثالث (Q3).

في حالة وجود قيمة متطرفة في مجموعة بيانات، يتم تمييزها عادةً بنقطة صغيرة خارج نطاق الخط الطولي في المخطط المربع:

كيفية قراءة القيم المتطرفة في boxplots

عندما يحدث هذا، يتم ببساطة تعيين قيم “الحد الأدنى” و”الحد الأقصى” في boxplot بقيم Q1 – 1.5*IQR وQ3 + 1.5*IQR، على التوالي.

يوضح المثال التالي كيفية تفسير مخططات الصندوق مع القيم المتطرفة وبدونها.

مثال: تفسير مؤامرة مربعة مع القيم المتطرفة

لنفترض أننا أنشأنا المخططين الصندوقيين التاليين لتصور توزيع النقاط التي سجلها لاعبو كرة السلة من فريقين مختلفين:

لا تحتوي مؤامرة الصندوق اليسرى للفريق A على قيم متطرفة نظرًا لعدم وجود نقاط صغيرة تقع خارج الخط الطولي الأدنى أو الأقصى.

ومع ذلك، فإن مخطط الصندوق الصحيح للفريق B يحتوي على قيمة خارجية واحدة أعلى القيمة “الحد الأقصى” وقيمة خارجية واحدة أقل من القيمة “الحد الأدنى”.

فيما يلي الملخص الحالي المكون من خمسة أرقام لتوزيع متغير “النقاط” للفريق ب:

  • الحد الأدنى للقيمة: 1.1
  • الربع الأول: 10.5
  • المتوسط: 12.7
  • الربع الثالث: 15.6
  • القيمة القصوى: 23.5

فيما يلي كيفية حساب حدود القيم المتطرفة المحتملة:

المقياس الرباعي : الربع الثالث – الربع الأول = 15.6 – 10.5 = 5.1

الحد الأدنى : Q1 – 1.5*IQR = 10.5 – 1.5*5.1 = 2.85

الحد الأعلى : Q3 + 1.5*IQR = 15.6 + 1.5*5.1 = 23.25

يتم وضع شعيرات الحد الأدنى والحد الأقصى للقيم في boxplot عند 2.85 و 23.25 .

وبالتالي، فإن الملاحظات ذات القيم 1.1 و 23.5 تعتبر قيمًا متطرفة في boxplot لأنها تقع خارج الحدود الدنيا والعليا.

المكافأة : إليك الكود الدقيق الذي استخدمناه لإنشاء هاتين المخططتين boxplots في لغة برمجة R:

 library (ggplot2)

#make this example reproducible 
set. seeds (2)

#create data frame
df <- data. frame (Team = factor(rep(c("A", "B"), each = 200)), 
                 Points = c(rnorm(200, mean = 15, sd = 3), 
                           rnorm(200, mean = 12, sd = 4))) 

#create box plots
ggplot(df, aes(x = Team, y = Points)) +
  stat_boxplot(geom = " errorbar ", width = 0.5) +  
  geom_boxplot() 

#calculate summary statistics for each team
tapply(df$Points, df$Team, summary)

مصادر إضافية

توفر البرامج التعليمية التالية معلومات إضافية حول مخططات الصندوق:

كيفية مقارنة مؤامرات الصندوق
كيفية تحديد عدم التماثل في مخططات الصندوق
كيفية العثور على المدى الربيعي لboxplot

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *