Количество занятий (статистика)
В этой статье объясняется, как найти количество классов в статистике. Вы также узнаете, как рассчитывается ширина интервалов после нахождения количества классов и, кроме того, сможете увидеть несколько конкретных примеров.
Как посчитать количество классов в статистике
В основном в статистике существует два метода расчета идеального количества классов для выборки данных: правило Стерджеса, которое представляет собой формулу, и корневой метод, который включает в себя поиск квадратного корня из общего количества данных.
В зависимости от образца целесообразно использовать тот или иной метод. Оба метода объяснены ниже на примере.
Правило Стерджеса
Правило Стерджеса — это правило, используемое для расчета идеального количества классов или интервалов, на которые следует разделить набор данных. В частности, формула правила Стерджеса гласит, что подходящее количество классов равно одному плюс логарифм по основанию два от общего количества точек данных.
Золото
количество классов или интервалов и
— общее количество наблюдений в выборке.
Большинство калькуляторов позволяют выполнять вычисления только с логарифмами по основанию 10. В этом случае вы можете использовать эквивалентную формулу:
Например, если у нас есть статистическая выборка из 100 наблюдений, то по правилу Стерджеса количество классов, по которым должны быть сгруппированы данные, рассчитывается следующим образом:
Итак, для выборки, состоящей в общей сложности из 100 точек данных, данные необходимо разделить на 8 различных интервалов.
корневой метод
Хотя правило Стерджеса, безусловно, более известно, в статистике широко используется другой метод расчета количества классов — вычисление квадратного корня из размера выборки.
Итак, еще одна формула расчета идеального количества занятий выглядит следующим образом:
Золото
количество классов или интервалов и
— общее количество элементов данных в выборке.
Например, если у нас всего 150 фрагментов данных, расчет количества интервалов, на которые нам нужно разделить данные, будет выглядеть следующим образом:
Предыдущая формула используется, когда размер выборки меньше 200, но когда у нас 200 и более данных, количество классов лучше рассчитывать, взяв корень куба:
Золото
количество классов или интервалов и
— общее количество элементов данных в выборке.
Количество классов и ширина интервала
После того, как мы рассчитали количество интервалов, мы можем рассчитать ширину каждого интервала, используя следующую формулу:
В качестве примера ниже решено упражнение, чтобы вы могли увидеть, как рассчитывается ширина интервалов.
- Были зафиксированы следующие статистические данные. Рассчитайте количество классов с помощью правила Стерджеса, затем определите ширину каждого интервала.
Как мы видели выше, для определения количества классов, в которые следует сгруппировать данные, мы применяем правило Стерджеса. В данном случае у нас 39 данных, поэтому в формуле необходимо заменить параметр N на 39:
Теперь, когда мы знаем необходимое количество классов, давайте рассчитаем ширину каждого класса. Для этого нам сначала нужно вычислить диапазон выборочных данных:
И как только мы узнаем размер выборки, мы разделим найденное значение на количество классов, вычисленное ранее (6):
Поэтому ширина всех классов должна составлять 16 единиц. Таким образом, классы, которых мы могли бы достичь:
Количество классов в частотном распределении
Наконец, следует отметить, что расчет количества классов важен при составлении распределения частот (или таблицы частот), так вы сможете быстро разделить данные на разные интервалы, а затем найти все типы частот каждого интервала. .
Если вы не знаете, что это такое, распределение частот представляет собой таблицу, в которой перечислены все типы частот для каждого интервала. Таким образом, каждая строка представляет собой отдельный класс, а каждый столбец имеет свой тип частоты.
Чтобы просмотреть пример распределения частот с сгруппированными данными, щелкните следующую ссылку: