Незгрупований розподіл частот: визначення та приклад
Припустімо, ми проводимо опитування, під час якого ми запитуємо 15 домогосподарств, скільки тварин вони мають у своєму домі. Результати такі:
1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8
Один із способів узагальнити ці результати — створити частотний розподіл , який повідомляє нам, як часто різні значення з’являються в наборі даних.
Ми часто використовуємо кластерний розподіл частот , у якому ми створюємо групи значень, а потім підсумовуємо кількість спостережень у наборі даних, які потрапляють у ці групи.
Ось приклад згрупованого частотного розподілу для даних нашого опитування:
Спочатку ми створили групи розміром 2, а потім підрахували кількість окремих спостережень із набору даних, які потрапляють у кожну групу. Наприклад:
- 7 сімей мали по 1-2 тварини
- У 3 сім’ях було по 3-4 тварини
- У 3 сім’ях було по 5-6 тварин
- У 2 сім’ях було по 7-8 тварин
Ще один тип частотного розподілу, який ми можемо створити, — це незгрупований частотний розподіл , який відображає частоту кожного окремого значення даних, а не групи значень даних.
Ось приклад некластеризованого розподілу частот для даних нашого опитування:
Цей тип частотного розподілу дозволяє нам безпосередньо бачити, як часто різні значення зустрічаються в нашому наборі даних. Наприклад:
- На 4 родини було по 1 тварині
- У 3 сім’ях було по 2 тварини
- У 2 сім’ях було 3 тварини
- В 1 сім’ї було 4 тварини
І так далі.
Коли використовувати незгрупований розподіл частот
Незгрупований розподіл частот може бути корисним, якщо ви хочете побачити, як часто кожне окреме значення з’являється в наборі даних.
Зауважте, що некластеризовані розподіли частот найкраще працюють із невеликими наборами даних, у яких є лише кілька унікальних значень.
Наприклад, у даних нашого попереднього опитування було лише 8 унікальних значень, тому мало сенс створити некластеризований розподіл частот.
Однак, якби у нас був тисячний набір даних, який містив би сотні або унікальні значення, некластеризований розподіл частот зайняв би неймовірно багато часу, і з нього було б важко зібрати інформацію.
Для більших наборів даних має сенс побудувати згруповані частотні розподіли.
Як візуалізувати незгруповані частотні розподіли
Найпростіший спосіб візуалізації значень у незгрупованому розподілі частот – створити багатокутник частот , який відображає частоти кожного окремого значення на простому графіку.
Ось як виглядав би багатокутник частот для наших вибіркових даних:
Це допомагає нам швидко зрозуміти, як часто кожне значення з’являється в наборі даних.
Крім того, ми могли б створити гістограму для відображення тих самих даних за допомогою стовпчиків, а не однієї лінії:
Обидва графіки дозволяють нам швидко зрозуміти розподіл значень у нашому наборі даних.