كيفية تحديد فواصل الرسم البياني في r (مع أمثلة)
بشكل افتراضي، تستخدم الدالة hist() في R قاعدة Sturges لتحديد عدد الصناديق التي سيتم استخدامها في الرسم البياني.
تستخدم قاعدة Sturges الصيغة التالية لتحديد العدد الأمثل للمجموعات التي سيتم استخدامها في الرسم البياني:
الصناديق المثالية = ⌈log 2 n + 1⌉
ذهب:
- n: إجمالي عدد الملاحظات في مجموعة البيانات.
- ⌈ ⌉: رموز تعني “السقف”، أي تقريب الإجابة إلى أقرب عدد صحيح.
على سبيل المثال، إذا كان هناك 31 ملاحظة في مجموعة بيانات، فإن قاعدة Sturge ستستخدم الصيغة التالية لتحديد العدد الأمثل للمجموعات التي سيتم استخدامها في الرسم البياني:
الصناديق المثالية = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .
وفقا لقاعدة ستورجيس، يجب علينا استخدام 6 مربعات في الرسم البياني لتصور مجموعة البيانات هذه.
إذا كنت تستخدم الدالة hist() في R، فسيتم استخدام قاعدة Sturges لاختيار عدد الصناديق التي سيتم عرضها في الرسم البياني تلقائيًا.
hist(data)
حتى إذا كنت تستخدم وسيطة Breaks لتحديد عدد مختلف من الصناديق المراد استخدامها، فلن يستخدمها R إلا “كاقتراح” لعدد الصناديق المطلوب استخدامها.
hist(data, breaks= 7 )
ومع ذلك، يمكنك استخدام التعليمة البرمجية التالية لإجبار R على استخدام عدد محدد من المربعات في الرسم البياني:
#create histogram with 7 bins hist(data, breaks = seq(min(data), max(data), length. out = 8 ))
ملاحظة : يجب عليك استخدام طول n+1 لـ length.out حيث n هو عدد الصناديق التي تريدها.
يوضح المثال التالي كيفية استخدام هذا الرمز عمليًا.
مثال: تحديد فواصل الرسم البياني في R
لنفترض أن لدينا مجموعة البيانات التالية في R مع 16 قيمة:
#create vector of 16 values
data <- c(2, 3, 3, 3, 4, 4, 5, 6, 8, 10, 12, 14, 15, 18, 20, 21)
إذا استخدمنا الدالة hist() ، فسيقوم R بإنشاء الرسم البياني التالي مع 5 صناديق:
#create histogram
hist(data)
ملاحظة : استخدم R قاعدة Sturges لتحديد أن 5 مجموعات هي العدد الأمثل للمجموعات المستخدمة لتصور مجموعة بيانات تحتوي على 16 ملاحظة.
إذا حاولنا استخدام الوسيطة Breaks لتحديد 7 مجموعات لاستخدامها في الرسم البياني، فسيأخذ R هذا كـ “اقتراح” فقط ويختار استخدام 10 مجموعات بدلاً من ذلك:
#attempt to create histogram with 7 bins
hist(data, breaks= 7 )
ومع ذلك، يمكننا استخدام الكود التالي لإجبار R على استخدام 7 خانات في الرسم البياني:
#create histogram with 7 bins
hist(data, breaks = seq(min(data), max(data), length. out = 8 ))
لاحظ أن النتيجة هي رسم بياني يحتوي على 7 مربعات متساوية المسافات.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في R:
كيفية إنشاء رسم بياني للتردد النسبي في R
كيفية رسم رسوم بيانية متعددة في R