كيفية إنشاء boxplot مجمعة في r باستخدام ggplot2
تعتبر Boxplots مفيدة لتصور الملخص المكون من خمسة أرقام لمجموعة البيانات، والذي يتضمن:
- الحد الأدنى
- الربع الأول
- المتوسط
- الربع الثالث
- الحد الأقصى
ذات صلة: مقدمة لطيفة إلى Boxplots
لحسن الحظ، من السهل إنشاء boxplots في R باستخدام مكتبة التصور ggplot2 .
ويتضمن أيضًا إنشاء boxplots مجمعة حسب متغير معين في مجموعة بيانات. على سبيل المثال، لنفترض أن لدينا مجموعة البيانات التالية التي تعرض زيادة كفاءة 150 لاعب كرة سلة من ثلاثة فرق مختلفة بناءً على برنامجين تدريبيين مختلفين:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
يمكننا استخدام الكود التالي لإنشاء مخططات مربعة تعرض الزيادة في كفاءة اللاعب، مجمعة حسب الفريق ومملوءة بناءً على جدول التدريب:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
يمكننا استخدام بناء جملة مشابه لإنشاء مخططات مربعة تعرض الزيادة في كفاءة اللاعب، مجمعة حسب برنامج التدريب ومليئة بالفريق:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
البديل المماثل هو استخدام الواجهة ، حيث يتم عرض كل مجموعة فرعية في اللوحة الخاصة بها:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
اعتمادًا على البيانات التي تعمل بها، قد يفي إنشاء الجوانب باحتياجاتك المرئية وقد لا يلبيها.
مصادر إضافية
كيفية إزالة القيم المتطرفة في boxplots في R
كيفية إنشاء قطع أرض جنبًا إلى جنب في ggplot2
دليل كامل لأفضل موضوعات ggplot2