كيفية ضبط عدد الصناديق للرسم البياني في ggplot2
يمكنك استخدام وسيطة bins لتحديد عدد الصناديق المراد استخدامها في الرسم البياني في ggplot2 :
library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 )
توضح الأمثلة التالية كيفية استخدام هذه الوسيطة عمليًا.
مثال: قم بتعيين عدد الصناديق للرسم البياني في ggplot2
يوضح الكود التالي كيفية إنشاء مجموعة بيانات في R تحتوي على 10000 قيمة عشوائية تتبع توزيع بواسون بقيمة متوسطة 2:
#make this example reproducible
set. seeds (0)
#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))
#view first five rows of data frame
head(df)
values
1 4
2 1
3 1
4 2
5 4
6 1
يمكننا استخدام الكود التالي لإنشاء رسم بياني في ggplot2 لتصور توزيع القيم في إطار البيانات:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ')
افتراضيًا، سيحدد ggplot2 تلقائيًا عددًا معينًا من المربعات لاستخدامها في الرسم البياني.
ومع ذلك، يمكننا استخدام الصيغة التالية لتحديد أننا نريد أن يستخدم الرسم البياني 10 صناديق:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 10 )
لاحظ أن الرسم البياني يحتوي الآن على 10 مربعات بالضبط.
أو يمكننا استخدام الصيغة التالية لتحديد أننا نريد أن يستخدم الرسم البياني 5 صناديق:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 5 )
لاحظ أن الرسم البياني يحتوي الآن على 5 مربعات بالضبط.
ستجد أنه كلما قل عدد الصناديق التي تستخدمها، كلما أصبحت كل حاوية أوسع.
بشكل عام، إذا كنت تستخدم مجموعات قليلة جدًا، فسيتم إخفاء التوزيع الأساسي الحقيقي للقيم.
ومع ذلك، إذا كنت تستخدم عددًا كبيرًا جدًا من المجموعات، فإنك تخاطر ببساطة برؤية الضجيج في البيانات.
إحدى الطرق للعثور على العدد الأمثل من الصناديق لاستخدامها في الرسم البياني هي استخدام قاعدة Sturges . تعرف على المزيد حول هذه القاعدة هنا .
ملاحظة : يمكنك العثور على الوثائق الكاملة لوظيفة Geom_histogram هنا .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية إنشاء رسوم بيانية شائعة أخرى في R:
كيفية إنشاء رسم بياني للتردد النسبي في R
كيفية رسم boxplots متعددة في رسم بياني واحد في R
كيفية رسم خطوط متعددة في الرسم البياني في R