班级数(统计)

本文介绍了如何在统计中查找类的数量。在找到类的数量后,您还将了解如何计算间隔的宽度,此外,您还可以看到几个具体示例。

统计中如何计算类数

在统计学中,主要有两种计算数据样本的理想类数的方法:斯特吉斯法则(Sturges’ Rule)(一种公式)和求根法(Root Method),即求数据总数的平方根。

根据样品的不同,建议使用一种或另一种方法。下面通过示例解释这两种方法。

斯特奇斯法则

斯特吉斯规则是用于计算数据集应划分的理想类数或区间数的规则。具体来说,斯特吉斯规则公式指出,适当的类数等于一加上数据点总数的以 2 为底的对数。

c=1+\log_2(N)

金子

c

是班级或间隔的数量,

N

是样本中观测值的总数。

大多数计算器只允许以 10 为底的对数进行计算。在这种情况下,您可以使用以下等效公式:

c=1+\cfrac{\log(N)}{\log(2)}

例如,如果我们有 100 个观测值的统计样本,根据 Sturges 规则,数据应分组的类数计算如下:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

因此,对于总共 100 个数据点的样本,必须将数据分为 8 个不同的区间。

根法

尽管斯特吉斯规则肯定更为人所知,但统计学中广泛使用的另一种计算类数的方法是计算样本量的平方根。

因此,计算理想类数的另一个公式如下:

c=\sqrt{N}

金子

c

是班级或间隔的数量,

N

是样本中数据项的总数。

例如,如果我们总共有150条数据,那么我们需要将数据划分为的区间数的计算为:

c=\sqrt{150}=12,25 \approx 12

当样本量小于200时,使用前面的公式,但是当我们有200或更多数据时,最好通过取立方根来计算类数:

c=\sqrt[3]{N}

金子

c

是班级或间隔的数量,

N

是样本中数据项的总数。

类别数量和间隔宽度

一旦我们计算出了 bin 的数量,我们就可以使用以下公式计算每个间隔的宽度:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

作为示例,下面解决了一个练习,以便您可以了解如何计算间隔的宽度。

  • 记录以下统计数据。使用 Sturges 规则计算类别数,然后确定每个区间的宽度。

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

正如我们在上面看到的,为了确定数据应分组的类数,我们应用斯特奇斯规则。在本例中我们有 39 个数据,因此在公式中我们必须将参数N替换为 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

现在我们知道了适当的类数,让我们计算每个类的宽度。为此,我们首先需要计算样本数据的范围:

R=98-2=96

一旦我们知道样本的范围,我们将找到的值除以之前计算的类数 (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

因此,所有类别的宽度必须为 16 个单位。因此,我们可以实现的类是:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

频率分布中的类数

最后需要注意的是,在制作频数分布(或频数表)时,计算类的数量很重要,这样可以快速将数据分成不同的区间,然后找到每个区间的所有频数类型。 。

如果您不知道它是什么,频率分布是一个列出每个间隔的所有频率类型的表格。因此,每一行都是一个不同的类,每一列都有不同的频率类型。

要查看分组数据的频率分布示例,请单击以下链接:

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注