Незгрупований розподіл частот: визначення та приклад


Припустімо, ми проводимо опитування, під час якого ми запитуємо 15 домогосподарств, скільки тварин вони мають у своєму домі. Результати такі:

1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8

Один із способів узагальнити ці результати — створити частотний розподіл , який повідомляє нам, як часто різні значення з’являються в наборі даних.

Ми часто використовуємо кластерний розподіл частот , у якому ми створюємо групи значень, а потім підсумовуємо кількість спостережень у наборі даних, які потрапляють у ці групи.

Ось приклад згрупованого частотного розподілу для даних нашого опитування:

Спочатку ми створили групи розміром 2, а потім підрахували кількість окремих спостережень із набору даних, які потрапляють у кожну групу. Наприклад:

  • 7 сімей мали по 1-2 тварини
  • У 3 сім’ях було по 3-4 тварини
  • У 3 сім’ях було по 5-6 тварин
  • У 2 сім’ях було по 7-8 тварин

Ще один тип частотного розподілу, який ми можемо створити, — це незгрупований частотний розподіл , який відображає частоту кожного окремого значення даних, а не групи значень даних.

Ось приклад некластеризованого розподілу частот для даних нашого опитування:

Приклад незгрупованого розподілу частот

Цей тип частотного розподілу дозволяє нам безпосередньо бачити, як часто різні значення зустрічаються в нашому наборі даних. Наприклад:

  • На 4 родини було по 1 тварині
  • У 3 сім’ях було по 2 тварини
  • У 2 сім’ях було 3 тварини
  • В 1 сім’ї було 4 тварини

І так далі.

Коли використовувати незгрупований розподіл частот

Незгрупований розподіл частот може бути корисним, якщо ви хочете побачити, як часто кожне окреме значення з’являється в наборі даних.

Зауважте, що некластеризовані розподіли частот найкраще працюють із невеликими наборами даних, у яких є лише кілька унікальних значень.

Наприклад, у даних нашого попереднього опитування було лише 8 унікальних значень, тому мало сенс створити некластеризований розподіл частот.

Однак, якби у нас був тисячний набір даних, який містив би сотні або унікальні значення, некластеризований розподіл частот зайняв би неймовірно багато часу, і з нього було б важко зібрати інформацію.

Для більших наборів даних має сенс побудувати згруповані частотні розподіли.

Як візуалізувати незгруповані частотні розподіли

Найпростіший спосіб візуалізації значень у незгрупованому розподілі частот – створити багатокутник частот , який відображає частоти кожного окремого значення на простому графіку.

Ось як виглядав би багатокутник частот для наших вибіркових даних:

Частотний полігон для незгрупованого розподілу частот

Це допомагає нам швидко зрозуміти, як часто кожне значення з’являється в наборі даних.

Крім того, ми могли б створити гістограму для відображення тих самих даних за допомогою стовпчиків, а не однієї лінії:

Гістограма для незгрупованого розподілу частот

Обидва графіки дозволяють нам швидко зрозуміти розподіл значень у нашому наборі даних.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *