计数不足偏差：解释和示例

经过本杰明·安德森博 7月 29, 2023 指导 0 条评论

计数不足偏差是当总体中的某些成员在样本中没有得到充分代表时发生的偏差。

这种类型的偏差经常发生在便利抽样和自愿响应抽样中，在这些抽样中，您收集的样本很容易获得，但往往会低估总体中的某些成员。

计数不足偏差是一个问题，因为它导致样本不能代表总体。收集样本数据的目的是以比收集整个总体数据更快、更简单的方式获取数据，并能够将样本结果外推到更大的总体。宽的。

然而，为了推断结果，样本必须能够代表我们的整体人口。理想情况下，我们希望我们的样本是总体的“迷你”版本。不幸的是，计数不足偏差可能会导致我们样本中的人看起来与更广泛的人群中的人非常不同。

例如，假设研究人员想知道某个城市的公民对一项潜在的新法律的看法。为了收集数据，他们去附近的图书馆询问访客对潜在的新法律的看法。虽然这是一种收集数据的便捷方式，但研究人员可能会低估几种类型的人，包括：

由于这项研究排除了某些类型的人群，因此研究结果不太可能代表人群。

例如，假设经常光顾这个特定图书馆的人比其他人更有可能支持潜在的新法律。这意味着，当调查结果公布时，该市有很高比例的公民支持潜在的新法律，而实际上大多数公民并不支持。

下图说明了这个问题：假设绿色圆圈代表支持新法律的人，而红色圆圈代表反对新法律的人：

请注意，大多数支持新法律的人都包含在样本中，但它并不能代表整个人口。据报道，调查结果显示大多数人支持新法律，但实际上情况并非如此。

少计偏差的示例

以下示例说明了可能发生少计偏差的几种情况。

研究人员想了解某个城市的居民对建设新公园的看法。为了收集数据，研究人员参加了当地的城镇会议并询问居民的想法。不幸的是，这种形式的便利抽样可能会低估以下群体：

因此，研究结果不会考虑这些人的意见。由于对这些特定群体的计数不足，样本不太可能代表整个人口。

研究人员想知道某个国家的人们每天看电视的时间有多少。为了收集研究数据，他们从当地电话簿中随机挑选姓名，并打电话给人们询问他们的电视消费情况。这是一种方便抽样的形式，可能会低估以下组：

因此，在这项研究中，非常富有的人和年轻人观看电视的数量将被低估。由于对这些特定群体的计数不足，样本不太可能代表整个人口。

研究人员想知道某个城市的居民对新交通法规的看法。因此，他们向经过当地购物中心的人们分发了一份调查问卷。这是一种方便抽样的形式，可能会因以下群体的覆盖不足而受到影响：

因此，研究结果不会考虑这些人的意见。由于对这些特定群体的计数不足，样本不太可能代表整个人口。

低估偏差通常是由便利抽样造成的。为了消除（或至少最小化）计数不足偏差的影响，更好的抽样形式是使用简单的随机样本。

在这种类型的样本中，总体中的每个成员都有相同的机会被选为样本的一部分。

这种方法的优点是简单的随机样本通常能够代表感兴趣的总体，因为每个成员都有平等的机会被包含在样本中。

当我们使用这种方法而不是方便抽样时，我们可以更有信心将样本结果外推到更广泛的人群，因为样本中可能包含每个（或几乎每个）群体的成员。。

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多