Негруппированное распределение частот: определение и пример


Предположим, мы проводим опрос, в котором спрашиваем 15 домохозяйств, сколько животных у них дома. Результаты приведены ниже:

1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8

Один из способов обобщить эти результаты — создать распределение частот , которое говорит нам, как часто в наборе данных появляются разные значения.

Мы часто используем кластерные распределения частот , в которых мы создаем группы значений, а затем суммируем количество наблюдений в наборе данных, которые попадают в эти группы.

Вот пример сгруппированного распределения частот для данных нашего опроса:

Сначала мы создали группы размером 2, а затем подсчитали количество отдельных наблюдений из набора данных, попавших в каждую группу. Например:

  • В 7 семьях было 1 или 2 животных
  • В 3 семьях было 3 или 4 животных.
  • В 3 семьях было 5 или 6 животных.
  • В 2 семьях было 7 или 8 животных.

Другой тип распределения частот, который мы могли бы создать, — это несгруппированное распределение частот , которое отображает частоту каждого отдельного значения данных, а не групп значений данных.

Вот пример некластеризованного распределения частот для данных нашего опроса:

Пример несгруппированного распределения частот

Этот тип распределения частот позволяет нам напрямую видеть, как часто в нашем наборе данных встречаются разные значения. Например:

  • В 4 семьях было по 1 животному
  • В 3 семьях было по 2 животных
  • В 2 семьях было по 3 животных
  • В 1 семье было 4 животных

И так далее.

Когда использовать несгруппированные распределения частот

Негруппированные распределения частот могут быть полезны, если вы хотите увидеть, как часто каждое отдельное значение появляется в наборе данных.

Обратите внимание, что некластеризованные распределения частот лучше всего работают с небольшими наборами данных, в которых имеется лишь несколько уникальных значений.

Например, в данных нашего предыдущего опроса было всего 8 уникальных значений, поэтому имело смысл создать некластеризованное распределение частот.

Однако, если бы у нас были тысячи наборов данных, содержащих сотни или уникальные значения, некластеризованное распределение частот было бы невероятно трудоемким и трудным для сбора информации.

Для больших наборов данных имеет смысл построить сгруппированные распределения частот.

Как визуализировать несгруппированные распределения частот

Самый простой способ визуализировать значения в несгруппированном распределении частот — создать многоугольник частот , который отображает частоты каждого отдельного значения на простом графике.

Вот как будет выглядеть многоугольник частот для нашего примера данных:

Многоугольник частот для несгруппированного распределения частот

Это помогает нам быстро понять, как часто каждое значение появляется в наборе данных.

В качестве альтернативы мы могли бы создать гистограмму для отображения тех же данных с помощью столбцов, а не одной линии:

Гистограмма для несгруппированного распределения частот

Оба графика позволяют нам быстро понять распределение значений в нашем наборе данных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *