计数不足偏差:解释和示例


计数不足偏差是当总体中的某些成员在样本中没有得到充分代表时发生的偏差。

这种类型的偏差经常发生在便利抽样自愿响应抽样中,在这些抽样中,您收集的样本很容易获得,但往往会低估总体中的某些成员。

为什么少计偏差是一个问题?

计数不足偏差是一个问题,因为它导致样本不能代表总体。收集样本数据的目的是以比收集整个总体数据更快、更简单的方式获取数据,并能够将样本结果外推到更大的总体。宽的。

然而,为了推断结果,样本必须能够代表我们的整体人口。理想情况下,我们希望我们的样本是总体的“迷你”版本。不幸的是,计数不足偏差可能会导致我们样本中的人看起来与更广泛的人群中的人非常不同。

例如,假设研究人员想知道某个城市的公民对一项潜在的新法律的看法。为了收集数据,他们去附近的图书馆询问访客对潜在的新法律的看法。虽然这是一种收集数据的便捷方式,但研究人员可能会低估几种类型的人,包括:

  • 人们被限制在家里
  • 不喜欢去图书馆的人
  • 去镇上另一个地方的另一个图书馆的人

由于这项研究排除了某些类型的人群,因此研究结果不太可能代表人群。

例如,假设经常光顾这个特定图书馆的人比其他人更有可能支持潜在的新法律。这意味着,当调查结果公布时,该市有很高比例的公民支持潜在的新法律,而实际上大多数公民并不支持。

下图说明了这个问题:假设绿色圆圈代表支持新法律的人,而红色圆圈代表反对新法律的人:

请注意,大多数支持新法律的人都包含在样本中,但它并不能代表整个人口。据报道,调查结果显示大多数人支持新法律,但实际上情况并非如此。

少计偏差的示例

以下示例说明了可能发生少计偏差的几种情况。

实施例1

研究人员想了解某个城市的居民对建设新公园的看法。为了收集数据,研究人员参加了当地的城镇会议并询问居民的想法。不幸的是,这种形式的便利抽样可能会低估以下群体:

  • 没有交通工具参加市政会议的人
  • 人们甚至不知道城镇会议正在召开
  • 晚上工作而根本无法参加城镇会议的人

因此,研究结果不会考虑这些人的意见。由于对这些特定群体的计数不足,样本不太可能代表整个人口。

实施例2

研究人员想知道某个国家的人们每天看电视的时间有多少。为了收集研究数据,他们从当地电话簿中随机挑选姓名,并打电话给人们询问他们的电视消费情况。这是一种方便抽样的形式,可能会低估以下组:

  • 非常富有的人没有在当地电话簿中列出他们的电话号码
  • 只使用手机且号码未在本地电话簿中列出的年轻人

因此,在这项研究中,非常富有的人和年轻人观看电视的数量将被低估。由于对这些特定群体的计数不足,样本不太可能代表整个人口。

实施例3

研究人员想知道某个城市的居民对新交通法规的看法。因此,他们向经过当地购物中心的人们分发了一份调查问卷。这是一种方便抽样的形式,可能会因以下群体的覆盖不足而受到影响:

  • 没有交通工具前往购物中心的人(因此基本上不受高速公路法规的影响)
  • 不喜欢去商场的人(因此可能选择不在繁忙地区开车)
  • 人们去另一个城市的另一个购物中心

因此,研究结果不会考虑这些人的意见。由于对这些特定群体的计数不足,样本不太可能代表整个人口。

如何防止少算偏差

低估偏差通常是由便利抽样造成的。为了消除(或至少最小化)计数不足偏差的影响,更好的抽样形式是使用简单的随机样本

在这种类型的样本中,总体中的每个成员都有相同的机会被选为样本的一部分。

这种方法的优点是简单的随机样本通常能够代表感兴趣的总体,因为每个成员都有平等的机会被包含在样本中。

当我们使用这种方法而不是方便抽样时,我们可以更有信心将样本结果外推到更广泛的人群,因为样本中可能包含每个(或几乎每个)群体的成员。 。

其他资源

什么是自我选择偏差?
什么是SEO偏见?
什么是无反应偏差?

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注