كيفية إزالة القيم المتطرفة في boxplots في r


في بعض الأحيان قد ترغب في إزالة القيم المتطرفة من boxplots في R.

يشرح هذا البرنامج التعليمي كيفية القيام بذلك باستخدام كل من R الأساسي و ggplot2 .

إزالة القيم المتطرفة في boxplots في Base R

لنفترض أن لدينا مجموعة البيانات التالية:

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

يوضح التعليمة البرمجية التالية كيفية إنشاء boxplot لمجموعة البيانات هذه في الأساس R:

 boxplot(data)

لإزالة القيم المتطرفة، يمكنك استخدام الوسيطة التفصيلية=FALSE :

 boxplot(data, outline= FALSE ) 

Boxplot مع إزالة القيم المتطرفة في R

إزالة القيم المتطرفة في boxplots في ggplot2

لنفترض أن لدينا مجموعة البيانات التالية:

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

يوضح التعليمة البرمجية التالية كيفية إنشاء boxplot باستخدام مكتبة التصور ggplot2:

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

لإزالة القيم المتطرفة، يمكنك استخدام الوسيطة outlier.shape=NA :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

ggplot2 boxplot مع إزالة القيم المتطرفة

لاحظ أن ggplot2 لا يقوم بضبط المحور y تلقائيًا.

لضبط المحور y يمكنك استخدام coord_cartesian :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

boxplot ggplot2 بدون القيم المتطرفة

يتراوح المحور y الآن من 5 إلى 30، كما حددنا باستخدام الوسيطة ylim() .

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في ggplot2:

كيفية تعيين حدود المحور في ggplot2
كيفية إنشاء قطع أرض جنبًا إلى جنب في ggplot2
كيفية تسمية القيم المتطرفة في boxplots في ggplot2

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *