ما هو ستيرجيس؟ مسطرة؟ (التعريف & #038؛ مثال)
الرسم البياني هو رسم بياني يساعدنا على تصور توزيع القيم في مجموعة من البيانات.
لقد اتضح أن عدد المربعات المستخدمة في الرسم البياني يمكن أن يكون له تأثير كبير على كيفية تفسيرنا للبيانات.
إذا استخدمنا عددًا قليلًا جدًا من المجموعات، فيمكن إخفاء النمط الأساسي الحقيقي في البيانات:

وإذا استخدمنا عددًا كبيرًا جدًا من المجموعات، فيمكننا ببساطة تصور التشويش في مجموعة البيانات:

ولحسن الحظ، يمكننا استخدام طريقة تعرف باسم قاعدة ستورجيس لتحديد العدد الأمثل للمربعات التي سيتم استخدامها في الرسم البياني.
تستخدم قاعدة Sturges الصيغة التالية لتحديد العدد الأمثل للمجموعات التي سيتم استخدامها في الرسم البياني:
الصناديق المثالية = ⌈log 2 n + 1⌉
ذهب:
- n: إجمالي عدد الملاحظات في مجموعة البيانات.
- ⌈ ⌉: رموز تعني “السقف”، أي تقريب الإجابة إلى أقرب عدد صحيح.
مثال: قاعدة ستورجيس
لنفترض أن لدينا مجموعة البيانات التالية بإجمالي n = 31 ملاحظة:

يمكننا استخدام قاعدة Sturges لتحديد العدد الأمثل للمربعات التي سيتم استخدامها لتصور هذه القيم في الرسم البياني:
الصناديق المثالية = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .
وفقا لقاعدة Sturges، يجب علينا استخدام 6 صناديق في الرسم البياني الذي نستخدمه لتصور هذا التوزيع للقيم.
هذا هو الشكل الذي سيبدو عليه الرسم البياني الذي يحتوي على 6 مجموعات لمجموعة البيانات هذه:

لاحظ كيف يبدو هذا كافيًا للحصول على فكرة جيدة عن التوزيع الأساسي للقيم دون أن تكون كثيرة جدًا بحيث لا يمكنك ببساطة تصور التشويش في البيانات.
القيم المشتركة لقاعدة ستورجيس
يوضح الجدول التالي العدد الأمثل للمجموعات التي سيتم استخدامها في الرسم البياني بناءً على إجمالي عدد الملاحظات في مجموعة البيانات، وفقًا لقاعدة Sturges:

بدائل لقاعدة ستورجيس
قاعدة Sturges هي الطريقة الأكثر شيوعًا لتحديد العدد الأمثل من الصناديق لاستخدامها في الرسم البياني، ولكن هناك عدة طرق بديلة، بما في ذلك:
قاعدة الجذر التربيعي : عدد الصناديق = ⌈√ n ⌉
قاعدة الأرز: عدد الصناديق = ⌈2 * 3 √ n ⌉
قاعدة فريدمان-دياكونيس: عدد الصناديق = (2*IQR) / 3 √ n حيث IQR هو المدى الربيعي.
المكافأة: حاسبة قاعدة Sturges
استخدم هذه الآلة الحاسبة المجانية عبر الإنترنت لتطبيق قاعدة Sturges تلقائيًا لتحديد العدد الأمثل للمجموعات التي سيتم استخدامها في الرسم البياني بناءً على حجم مجموعة البيانات.