无反应偏差:解释和示例
无回应偏差是指当对调查作出回应的人与不回应调查的人存在显着差异时发生的偏见。
出现无反应偏差的原因有多种:
- 该调查设计不当,导致没有回应。例如,调查时间过长而没有激励措施可能会导致很大一部分人无法完成调查。
- 有些人更有可能对特定调查做出回应。例如,经常攀岩的人比不攀岩的人更有可能对有关潜在新攀岩设施的调查做出回应。
- 该调查并未覆盖所有人口。例如,在新手机应用程序上发送的调查可能只针对拥有该应用程序的年轻人,从而导致老年人不做出回应。
- 该调查提出了有关私人信息的尴尬问题,这让许多人不敢做出回应。
所有这些原因都可能导致不回应偏差。
为什么无反应偏差是一个问题?
无反应偏差是一个问题,主要原因有两个:
1. 无应答偏差导致样本不能代表总体总体。收集样本数据的好处是,它比收集整个总体数据更快、更便宜,并且可以将样本结果外推到更大的总体。
然而,为了推断结果,样本必须能够代表我们的整体人口。理想情况下,我们希望我们的样本是总体的“迷你”版本。
不幸的是,无反应偏差可能会导致我们样本中的人看起来与更广泛的人群中的人非常不同。
例如,假设一个城市正在考虑建造一个新的攀岩设施。为了了解城市居民对使用此类设施的兴趣,市政府官员正在通过一款新的智能手机应用程序发送一份简短的调查。
由于调查的方式和调查内容(有关攀岩的问题),主要是有申请且对攀岩感兴趣的年轻人做出回应。
因此,当调查结果回来时,似乎该市绝大多数人口都有兴趣建造这个新设施。不幸的是,调查结果并不能代表整个人口。
下图说明了这个问题:假设绿色圆圈代表对使用该设施感兴趣的人,而红色圆圈代表对使用该设施不感兴趣的人:
请注意样本如何不能代表整个总体。调查结果显示,大多数人对新的攀岩设施感到兴奋。不幸的是,如果城市官员认为这个样本代表了人口,他们可能会决定建造该设施,并很快意识到使用它的人比他们想象的要少得多。
2. 无响应偏差可能会导致估计值出现较大差异。如果调查样本量小于研究人员计划使用的样本量,则研究估计的方差可能会大于预期。
例如,通过假设检验,我们知道样本量越大,总体平均值或总体比例估计的方差越低。然而,我们的样本量越小,总体参数估计的方差就越大,找到具有统计显着性的结果就越困难。
无反应偏差的例子
以下示例说明了可能出现无响应偏差的几种情况。
实施例1
研究人员想知道计算机科学家如何看待新软件。从调查中获取尽可能多的数据存在压力,因此研究人员设计了一项大约需要一个小时的调查。当他们分发调查问卷时,他们发现许多 IT 员工要么根本不回应,要么开始回应但最终在完成整个调查之前就放弃了。
当研究人员检索数据时,他们发现受访者认为该软件非常优秀且质量很高。然而,当他们向一般 IT 团队推出新软件后,他们发现收到的反馈大多是负面的。
事实证明,花时间完成整个调查的人大多是新手计算机科学家,无法评估该程序的缺陷。
因此,调查受访者并未反映更广泛的 IT 专业人员整体情况,因此调查结果不可靠。
实施例2
研究人员想更多地了解某所大学的饮酒率。他们决定在校园里设立一个摊位,学生可以停下来接受一份关于饮酒量和饮酒频率的调查问卷。不幸的是,调查问卷不是匿名的,因此只有很少喝酒或根本不喝酒的学生才会选择填写调查问卷。
当结果出来时,学生的饮酒量似乎很低而且很少。不幸的是,调查受访者并未反映校园内更广泛的学生群体,因此结果不可靠。
实施例3
1936 年的总统选举是不回应偏见的典型例子。当时的一份热门出版物发表了一项民意调查,预测阿尔夫·兰登将以压倒性优势击败富兰克林·罗斯福。然而,当选举到来时,富兰克林·罗斯福实际上赢得了压倒性胜利。
事实证明,在发出的 1000 万份问卷中,只有 230 万人回复。结果发现,这770万没有做出回应的人在政策偏好方面存在很大差异。
因此,调查问卷结果并没有反映整个人口的情况,这就是为什么阿尔夫·兰登获胜的预测结果如此错误。
如何防止无反应偏差
通过采取以下步骤可以避免(或至少减轻)不回答偏差:
- 将调查设计得相对较短。调查时间越长,人们花时间做出回应的可能性就越小。
- 为完成调查提供奖励。激励措施通常会提高回复率。
- 确保人们知道调查回复将是保密或匿名的。这通常会让人们更愿意做出回应。
- 分发调查问卷,使其覆盖大部分人口,例如使用传统的分发形式,而不是很少有人拥有的新应用程序。
尽管并不总是能够完全消除无答复偏差的影响,但可以通过使用智能调查设计和分布方法来最大限度地减少这些影响。