عدد الفصول (إحصائيات)

تشرح هذه المقالة كيفية العثور على عدد الفئات في الإحصائيات. سوف تكتشف أيضًا كيفية حساب عرض الفواصل الزمنية بعد العثور على عدد الفئات، بالإضافة إلى ذلك، ستتمكن من رؤية العديد من الأمثلة الملموسة.

كيفية حساب عدد الفئات في الإحصاء

بشكل أساسي، في الإحصاء، هناك طريقتان لحساب العدد المثالي للفئات لعينة البيانات: قاعدة Sturges، وهي عبارة عن صيغة، وطريقة الجذر، والتي تتضمن إيجاد الجذر التربيعي لإجمالي عدد البيانات.

اعتمادا على العينة، فمن المستحسن استخدام طريقة أو أخرى. يتم شرح كلتا الطريقتين أدناه مع مثال.

حكم ستورجيس

قاعدة Sturges هي قاعدة تستخدم لحساب العدد المثالي للفئات أو الفواصل الزمنية التي يجب تقسيم مجموعة البيانات إليها. على وجه التحديد، تنص صيغة قاعدة Sturges على أن العدد المناسب من الفئات يساوي واحدًا بالإضافة إلى اللوغاريتم الأساسي الثاني لإجمالي عدد نقاط البيانات.

c=1+\log_2(N)

ذهب

c

هو عدد الطبقات أو الفواصل الزمنية و

N

هو العدد الإجمالي للملاحظات في العينة.

تسمح معظم الآلات الحاسبة بإجراء العمليات الحسابية باستخدام اللوغاريتمات ذات الأساس 10 فقط. في هذه الحالة، يمكنك استخدام هذه الصيغة المكافئة:

c=1+\cfrac{\log(N)}{\log(2)}

على سبيل المثال، إذا كانت لدينا عينة إحصائية مكونة من 100 ملاحظة، وفقًا لقاعدة Sturges، فسيتم حساب عدد الفئات التي يجب تجميع البيانات معها على النحو التالي:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

لذلك، بالنسبة لعينة تحتوي على إجمالي 100 نقطة بيانات، يجب تقسيم البيانات إلى 8 فترات زمنية مختلفة.

طريقة الجذر

على الرغم من أن قاعدة ستورجيس معروفة بشكل أفضل، إلا أن هناك طريقة أخرى تستخدم على نطاق واسع في الإحصاء لحساب عدد الفئات وهي حساب الجذر التربيعي لحجم العينة.

لذلك، هناك صيغة أخرى لحساب العدد المثالي للفصول هي كما يلي:

c=\sqrt{N}

ذهب

c

هو عدد الطبقات أو الفواصل الزمنية و

N

هو العدد الإجمالي لعناصر البيانات في العينة.

على سبيل المثال، إذا كان لدينا إجمالي 150 قطعة من البيانات، فسيكون حساب عدد الفواصل الزمنية التي نحتاج إلى تقسيم البيانات إليها كما يلي:

c=\sqrt{150}=12,25 \approx 12

يتم استخدام الصيغة السابقة عندما يكون حجم العينة أقل من 200، ولكن عندما يكون لدينا 200 بيانات أو أكثر فمن الأفضل حساب عدد الفئات من خلال أخذ الجذر التكعيبي:

c=\sqrt[3]{N}

ذهب

c

هو عدد الطبقات أو الفواصل الزمنية و

N

هو العدد الإجمالي لعناصر البيانات في العينة.

عدد الفئات وعرض الفاصل الزمني

بمجرد أن نحسب عدد الخانات، يمكننا حساب العرض الذي يجب أن تكون عليه كل فترة باستخدام الصيغة التالية:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

على سبيل المثال، تم حل تمرين أدناه حتى تتمكن من رؤية كيفية حساب عرض الفواصل الزمنية.

  • وتم تسجيل البيانات الإحصائية التالية. احسب عدد الفئات باستخدام قاعدة Sturges، ثم حدد عرض كل فاصل زمني.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

كما رأينا أعلاه، لتحديد عدد الفئات التي يجب تجميع البيانات فيها، فإننا نطبق قاعدة Sturges. في هذه الحالة لدينا 39 بيانات، لذلك في الصيغة يجب علينا استبدال المعلمة N بـ 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

الآن بعد أن عرفنا العدد المناسب من الفئات، دعونا نحسب عرض كل فئة. للقيام بذلك، نحتاج أولاً إلى حساب نطاق بيانات العينة:

R=98-2=96

وبمجرد معرفة مدى العينة نقسم القيمة الموجودة على عدد الأصناف المحسوبة سابقاً (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

ولذلك يجب أن يكون عرض جميع الفئات 16 وحدة. لذلك فإن الفئات التي يمكننا تحقيقها هي:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

عدد الفئات في التوزيع التكراري

أخيرًا، تجدر الإشارة إلى أن حساب عدد الفئات أمر مهم عند إجراء التوزيع التكراري (أو الجدول التكراري)، وبهذه الطريقة يمكنك فصل البيانات بسرعة إلى فترات مختلفة ومن ثم العثور على جميع أنواع التكرارات لكل فاصل زمني. .

في حال كنت لا تعرف ما هو، التوزيع التكراري هو جدول يسرد جميع أنواع التكرارات لكل فاصل زمني. لذا فإن كل صف هو فئة مختلفة وكل عمود له نوع تردد مختلف.

لمشاهدة مثال للتوزيع التكراري مع البيانات المجمعة، انقر فوق الرابط التالي:

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *