Количество занятий (статистика)

В этой статье объясняется, как найти количество классов в статистике. Вы также узнаете, как рассчитывается ширина интервалов после нахождения количества классов и, кроме того, сможете увидеть несколько конкретных примеров.

Как посчитать количество классов в статистике

В основном в статистике существует два метода расчета идеального количества классов для выборки данных: правило Стерджеса, которое представляет собой формулу, и корневой метод, который включает в себя поиск квадратного корня из общего количества данных.

В зависимости от образца целесообразно использовать тот или иной метод. Оба метода объяснены ниже на примере.

Правило Стерджеса

Правило Стерджеса — это правило, используемое для расчета идеального количества классов или интервалов, на которые следует разделить набор данных. В частности, формула правила Стерджеса гласит, что подходящее количество классов равно одному плюс логарифм по основанию два от общего количества точек данных.

c=1+\log_2(N)

Золото

c

количество классов или интервалов и

N

— общее количество наблюдений в выборке.

Большинство калькуляторов позволяют выполнять вычисления только с логарифмами по основанию 10. В этом случае вы можете использовать эквивалентную формулу:

c=1+\cfrac{\log(N)}{\log(2)}

Например, если у нас есть статистическая выборка из 100 наблюдений, то по правилу Стерджеса количество классов, по которым должны быть сгруппированы данные, рассчитывается следующим образом:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

Итак, для выборки, состоящей в общей сложности из 100 точек данных, данные необходимо разделить на 8 различных интервалов.

корневой метод

Хотя правило Стерджеса, безусловно, более известно, в статистике широко используется другой метод расчета количества классов — вычисление квадратного корня из размера выборки.

Итак, еще одна формула расчета идеального количества занятий выглядит следующим образом:

c=\sqrt{N}

Золото

c

количество классов или интервалов и

N

— общее количество элементов данных в выборке.

Например, если у нас всего 150 фрагментов данных, расчет количества интервалов, на которые нам нужно разделить данные, будет выглядеть следующим образом:

c=\sqrt{150}=12,25 \approx 12

Предыдущая формула используется, когда размер выборки меньше 200, но когда у нас 200 и более данных, количество классов лучше рассчитывать, взяв корень куба:

c=\sqrt[3]{N}

Золото

c

количество классов или интервалов и

N

— общее количество элементов данных в выборке.

Количество классов и ширина интервала

После того, как мы рассчитали количество интервалов, мы можем рассчитать ширину каждого интервала, используя следующую формулу:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

В качестве примера ниже решено упражнение, чтобы вы могли увидеть, как рассчитывается ширина интервалов.

  • Были зафиксированы следующие статистические данные. Рассчитайте количество классов с помощью правила Стерджеса, затем определите ширину каждого интервала.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Как мы видели выше, для определения количества классов, в которые следует сгруппировать данные, мы применяем правило Стерджеса. В данном случае у нас 39 данных, поэтому в формуле необходимо заменить параметр N на 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Теперь, когда мы знаем необходимое количество классов, давайте рассчитаем ширину каждого класса. Для этого нам сначала нужно вычислить диапазон выборочных данных:

R=98-2=96

И как только мы узнаем размер выборки, мы разделим найденное значение на количество классов, вычисленное ранее (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

Поэтому ширина всех классов должна составлять 16 единиц. Таким образом, классы, которых мы могли бы достичь:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Количество классов в частотном распределении

Наконец, следует отметить, что расчет количества классов важен при составлении распределения частот (или таблицы частот), так вы сможете быстро разделить данные на разные интервалы, а затем найти все типы частот каждого интервала. .

Если вы не знаете, что это такое, распределение частот представляет собой таблицу, в которой перечислены все типы частот для каждого интервала. Таким образом, каждая строка представляет собой отдельный класс, а каждый столбец имеет свой тип частоты.

Чтобы просмотреть пример распределения частот с сгруппированными данными, щелкните следующую ссылку:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *