统计学中的 10% 条件:定义和示例


伯努利试验是一种只有两种可能结果的实验——“成功”或“失败”——并且每次进行实验的成功概率都是相同的。

伯努利文章的一个例子是抛硬币。硬币只能落在两个正面(我们可以将正面称为“命中”,反面称为“失败”),并且假设硬币是公平的,每次翻转成功的概率为 0.5。

通常在统计学中,当我们想要计算涉及多个伯努利试验的概率时,我们使用正态分布作为近似值。然而,要做到这一点,我们必须假设试验是独立的。

在试验并非真正独立的情况下,如果我们使用的样本量不超过总体规模的 10%,我们始终可以假设它们是独立的。这称为10% 条件

10%条件:只要样本量小于或等于总体大小的10%,我们就可以始终假设伯努利检验是独立的。

10% 条件背后的直觉

要培养 10% 条件背后的直觉,请考虑以下示例。

假设某个班级中喜欢足球而不是篮球的学生的真实比例是 50%。令随机变量X为在 4 次试验中随机选择的更喜欢足球而不是篮球的学生人数。假设我们想要了解 4 名随机选择的学生更喜欢足球而不是篮球的概率。

如果我们的班级规模为 20 名学生,并且我们的试验是独立的(例如,我们可以对所有 20 名学生进行重复样本),那么每个学生比篮球更喜欢足球的概率可以计算如下:

P(4 个学生更喜欢足球) = 10/20 * 10/20 * 10/20 * 10/20 = .0625

然而,如果我们的试验不是独立的(例如,一旦我们对一个学生进行抽样,他们就无法返回课堂),那么所有 4 个学生都喜欢足球的概率将计算如下:

P(4 个学生更喜欢足球) = 10/20 * 9/19 * 8/18 * 7/17 = .0433

这两个概率是非常不同的。考虑到在此示例中,我们的样本量(4 名学生)不小于或等于总体(20 名学生)的 10%,因此我们将无法使用 10% 条件。

然而,请考虑下表,该表显示了根据班级规模随机选择的 4 名学生更喜欢足球的概率:

统计中10%的州

随着样本大小相对于总体大小(例如本例中的“班级大小”)的减小,独立试验和非独立试验之间计算的概率变得越来越接近。

请注意,当样本量恰好为总体大小的 10% 时,独立试验和非独立试验的概率差异相对相似。

当样本量远小于总体规模的10%时(例如表最后一行中仅为总体规模的0.4%),独立试验和非独立试验之间的概率极其接近。

结论

10% 条件规定我们的样本量必须小于或等于总体大小的 10%,才能安全地假设一组伯努利试验是独立的。

当然,我们的样本量最好远低于总体规模的 10%,以便我们对总体的推论尽可能准确。例如,我们希望样本量仅为总体的 5%,而不是 10%。

其他资源

正态分布简介
二项分布简介
中心极限定理简介

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注