كيفية إزالة القيم المتطرفة في boxplots في r
في بعض الأحيان قد ترغب في إزالة القيم المتطرفة من boxplots في R.
يشرح هذا البرنامج التعليمي كيفية القيام بذلك باستخدام كل من R الأساسي و ggplot2 .
إزالة القيم المتطرفة في boxplots في Base R
لنفترض أن لدينا مجموعة البيانات التالية:
data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)
يوضح التعليمة البرمجية التالية كيفية إنشاء boxplot لمجموعة البيانات هذه في الأساس R:
boxplot(data)
لإزالة القيم المتطرفة، يمكنك استخدام الوسيطة التفصيلية=FALSE :
boxplot(data, outline= FALSE )
إزالة القيم المتطرفة في boxplots في ggplot2
لنفترض أن لدينا مجموعة البيانات التالية:
data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))
يوضح التعليمة البرمجية التالية كيفية إنشاء boxplot باستخدام مكتبة التصور ggplot2:
library (ggplot2) ggplot(data, aes(y=y)) + geom_boxplot ()
لإزالة القيم المتطرفة، يمكنك استخدام الوسيطة outlier.shape=NA :
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA )
لاحظ أن ggplot2 لا يقوم بضبط المحور y تلقائيًا.
لضبط المحور y يمكنك استخدام coord_cartesian :
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA ) + coord_cartesian (ylim=c(5, 30))
يتراوح المحور y الآن من 5 إلى 30، كما حددنا باستخدام الوسيطة ylim() .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في ggplot2:
كيفية تعيين حدود المحور في ggplot2
كيفية إنشاء قطع أرض جنبًا إلى جنب في ggplot2
كيفية تسمية القيم المتطرفة في boxplots في ggplot2