Кількість класів (статистика)

У цій статті пояснюється, як знайти кількість класів у статистиці. Ви також дізнаєтеся, як розраховується ширина інтервалів після знаходження кількості класів і, крім того, ви зможете побачити кілька конкретних прикладів.

Як розрахувати кількість класів у статистиці

В основному в статистиці існує два методи обчислення ідеальної кількості класів для вибірки даних: правило Стерджеса, яке є формулою, і метод кореня, який передбачає знаходження квадратного кореня із загальної кількості даних.

Залежно від зразка доцільно використовувати той чи інший метод. Обидва методи пояснюються нижче на прикладі.

Правило Стерджеса

Правило Стерджеса — це правило, яке використовується для розрахунку ідеальної кількості класів або інтервалів, на які слід розділити набір даних. Зокрема, формула правила Стерджеса стверджує, що відповідна кількість класів дорівнює одиниці плюс логарифм за основою два від загальної кількості точок даних.

c=1+\log_2(N)

золото

c

це кількість класів або інтервалів і

N

– загальна кількість спостережень у вибірці.

Більшість калькуляторів дозволяють обчислювати лише логарифми за основою 10. У цьому випадку ви можете використати цю еквівалентну формулу:

c=1+\cfrac{\log(N)}{\log(2)}

Наприклад, якщо ми маємо статистичну вибірку зі 100 спостережень, то відповідно до правила Стерджеса кількість класів, за якими слід згрупувати дані, обчислюється наступним чином:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

Отже, для вибірки із загальною кількістю 100 точок даних дані потрібно розділити на 8 різних інтервалів.

кореневий спосіб

Хоча правило Стерджеса, безумовно, більш відоме, інший метод, який широко використовується в статистиці для обчислення кількості класів, полягає в обчисленні квадратного кореня з розміру вибірки.

Отже, інша формула для розрахунку ідеальної кількості класів виглядає наступним чином:

c=\sqrt{N}

золото

c

це кількість класів або інтервалів і

N

це загальна кількість елементів даних у вибірці.

Наприклад, якщо ми маємо загалом 150 фрагментів даних, розрахунок кількості інтервалів, на які потрібно розділити дані, буде таким:

c=\sqrt{150}=12,25 \approx 12

Попередня формула використовується, коли розмір вибірки менший за 200, але коли ми маємо 200 або більше даних, краще обчислити кількість класів, взявши кубічний корінь:

c=\sqrt[3]{N}

золото

c

це кількість класів або інтервалів і

N

це загальна кількість елементів даних у вибірці.

Кількість класів і ширина інтервалу

Після того як ми обчислили кількість бункерів, ми можемо обчислити ширину кожного інтервалу за такою формулою:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

Як приклад, нижче розв’язується вправа, щоб ви могли побачити, як обчислюється ширина інтервалів.

  • Були зафіксовані такі статистичні дані. Обчисліть кількість класів за правилом Стерджеса, потім визначте ширину кожного інтервалу.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Як ми бачили вище, щоб визначити кількість класів, у які слід згрупувати дані, ми застосовуємо правило Стерджеса. У цьому випадку ми маємо 39 даних, тому у формулі потрібно замінити параметр N на 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Тепер, коли ми знаємо відповідну кількість класів, давайте обчислимо ширину кожного класу. Для цього нам спочатку потрібно обчислити діапазон вибіркових даних:

R=98-2=96

І як тільки ми знаємо обсяг вибірки, ми ділимо отримане значення на кількість класів, обчислену раніше (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

Таким чином, ширина всіх класів має становити 16 одиниць. Отже, класи, які ми можемо отримати, це:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Кількість класів у частотному розподілі

Нарешті, слід зазначити, що обчислення кількості класів є важливим під час створення частотного розподілу (або таблиці частот), таким чином ви можете швидко розділити дані на різні інтервали, а потім знайти всі типи частот кожного інтервалу. .

Якщо ви не знаєте, що це таке, розподіл частот – це таблиця, у якій перераховано всі типи частот для кожного інтервалу. Таким чином, кожен рядок є окремим класом, а кожен стовпець має інший тип частоти.

Щоб побачити приклад розподілу частот із згрупованими даними, клацніть це посилання:

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *