Количество занятий (статистика)
В этой статье объясняется, как найти количество классов в статистике. Вы также узнаете, как рассчитывается ширина интервалов после нахождения количества классов и, кроме того, сможете увидеть несколько конкретных примеров.
Как посчитать количество классов в статистике
В основном в статистике существует два метода расчета идеального количества классов для выборки данных: правило Стерджеса, которое представляет собой формулу, и корневой метод, который включает в себя поиск квадратного корня из общего количества данных.
В зависимости от образца целесообразно использовать тот или иной метод. Оба метода объяснены ниже на примере.
Правило Стерджеса
Правило Стерджеса — это правило, используемое для расчета идеального количества классов или интервалов, на которые следует разделить набор данных. В частности, формула правила Стерджеса гласит, что подходящее количество классов равно одному плюс логарифм по основанию два от общего количества точек данных.
![]()
Золото
![]()
количество классов или интервалов и
![]()
— общее количество наблюдений в выборке.
Большинство калькуляторов позволяют выполнять вычисления только с логарифмами по основанию 10. В этом случае вы можете использовать эквивалентную формулу:
![]()
Например, если у нас есть статистическая выборка из 100 наблюдений, то по правилу Стерджеса количество классов, по которым должны быть сгруппированы данные, рассчитывается следующим образом:
![Rendered by QuickLaTeX.com \begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-f5bb532d94df60469d5d23fd0f2c4712_l3.png)
Итак, для выборки, состоящей в общей сложности из 100 точек данных, данные необходимо разделить на 8 различных интервалов.
корневой метод
Хотя правило Стерджеса, безусловно, более известно, в статистике широко используется другой метод расчета количества классов — вычисление квадратного корня из размера выборки.
Итак, еще одна формула расчета идеального количества занятий выглядит следующим образом:
![]()
Золото
![]()
количество классов или интервалов и
![]()
— общее количество элементов данных в выборке.
Например, если у нас всего 150 фрагментов данных, расчет количества интервалов, на которые нам нужно разделить данные, будет выглядеть следующим образом:
![]()
Предыдущая формула используется, когда размер выборки меньше 200, но когда у нас 200 и более данных, количество классов лучше рассчитывать, взяв корень куба:
![]()
Золото
![]()
количество классов или интервалов и
![]()
— общее количество элементов данных в выборке.
Количество классов и ширина интервала
После того, как мы рассчитали количество интервалов, мы можем рассчитать ширину каждого интервала, используя следующую формулу:
![]()
В качестве примера ниже решено упражнение, чтобы вы могли увидеть, как рассчитывается ширина интервалов.
- Были зафиксированы следующие статистические данные. Рассчитайте количество классов с помощью правила Стерджеса, затем определите ширину каждого интервала.
![]()
![]()
![]()
Как мы видели выше, для определения количества классов, в которые следует сгруппировать данные, мы применяем правило Стерджеса. В данном случае у нас 39 данных, поэтому в формуле необходимо заменить параметр N на 39:
![Rendered by QuickLaTeX.com \begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-b7b884d13f1c20fae5807dceddff2072_l3.png)
Теперь, когда мы знаем необходимое количество классов, давайте рассчитаем ширину каждого класса. Для этого нам сначала нужно вычислить диапазон выборочных данных:
![]()
И как только мы узнаем размер выборки, мы разделим найденное значение на количество классов, вычисленное ранее (6):
![]()
Поэтому ширина всех классов должна составлять 16 единиц. Таким образом, классы, которых мы могли бы достичь:
![Rendered by QuickLaTeX.com \begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-85277caa3ce99fe8c9c29f5df7d79933_l3.png)
Количество классов в частотном распределении
Наконец, следует отметить, что расчет количества классов важен при составлении распределения частот (или таблицы частот), так вы сможете быстро разделить данные на разные интервалы, а затем найти все типы частот каждого интервала. .
Если вы не знаете, что это такое, распределение частот представляет собой таблицу, в которой перечислены все типы частот для каждого интервала. Таким образом, каждая строка представляет собой отдельный класс, а каждый столбец имеет свой тип частоты.
Чтобы просмотреть пример распределения частот с сгруппированными данными, щелкните следующую ссылку: