Негруппированное распределение частот: определение и пример
Предположим, мы проводим опрос, в котором спрашиваем 15 домохозяйств, сколько животных у них дома. Результаты приведены ниже:
1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8
Один из способов обобщить эти результаты — создать распределение частот , которое говорит нам, как часто в наборе данных появляются разные значения.
Мы часто используем кластерные распределения частот , в которых мы создаем группы значений, а затем суммируем количество наблюдений в наборе данных, которые попадают в эти группы.
Вот пример сгруппированного распределения частот для данных нашего опроса:
Сначала мы создали группы размером 2, а затем подсчитали количество отдельных наблюдений из набора данных, попавших в каждую группу. Например:
- В 7 семьях было 1 или 2 животных
- В 3 семьях было 3 или 4 животных.
- В 3 семьях было 5 или 6 животных.
- В 2 семьях было 7 или 8 животных.
Другой тип распределения частот, который мы могли бы создать, — это несгруппированное распределение частот , которое отображает частоту каждого отдельного значения данных, а не групп значений данных.
Вот пример некластеризованного распределения частот для данных нашего опроса:
Этот тип распределения частот позволяет нам напрямую видеть, как часто в нашем наборе данных встречаются разные значения. Например:
- В 4 семьях было по 1 животному
- В 3 семьях было по 2 животных
- В 2 семьях было по 3 животных
- В 1 семье было 4 животных
И так далее.
Когда использовать несгруппированные распределения частот
Негруппированные распределения частот могут быть полезны, если вы хотите увидеть, как часто каждое отдельное значение появляется в наборе данных.
Обратите внимание, что некластеризованные распределения частот лучше всего работают с небольшими наборами данных, в которых имеется лишь несколько уникальных значений.
Например, в данных нашего предыдущего опроса было всего 8 уникальных значений, поэтому имело смысл создать некластеризованное распределение частот.
Однако, если бы у нас были тысячи наборов данных, содержащих сотни или уникальные значения, некластеризованное распределение частот было бы невероятно трудоемким и трудным для сбора информации.
Для больших наборов данных имеет смысл построить сгруппированные распределения частот.
Как визуализировать несгруппированные распределения частот
Самый простой способ визуализировать значения в несгруппированном распределении частот — создать многоугольник частот , который отображает частоты каждого отдельного значения на простом графике.
Вот как будет выглядеть многоугольник частот для нашего примера данных:
Это помогает нам быстро понять, как часто каждое значение появляется в наборе данных.
В качестве альтернативы мы могли бы создать гистограмму для отображения тех же данных с помощью столбцов, а не одной линии:
Оба графика позволяют нам быстро понять распределение значений в нашем наборе данных.