隐藏变量:定义和示例
隐藏变量是不包含在统计分析中但影响分析中两个变量之间关系的变量。
隐藏变量可以隐藏变量之间的真实关系,也可以错误地给人留下变量之间存在关系的印象。从本质上讲,隐藏变量可能会使研究结果产生误导。
在观察性研究中,重要的是要意识到隐藏变量可能会导致对数据和变量之间关系的异常解释。在实验研究中,以消除(尽可能多)隐藏变量风险的方式设计实验非常重要。
隐藏变量的示例
以下示例说明了研究中可能存在隐藏变量的几种情况:
实施例1
研究人员发现冰淇淋销售与鲨鱼袭击呈强烈正相关。这是否意味着冰淇淋销量的增加导致了更多的鲨鱼袭击?
这不太可能。最可能的原因是潜藏的多变天气。当外面变暖时,更多的人购买冰淇淋,更多的人去海边。
实施例2
研究人员发现,多年来爆米花的消费量与道路事故的数量密切相关。这是否意味着爆米花消费量增加会导致更多交通事故?
这不太可能。最有可能的原因是潜伏人口的变化。随着人口的增加,爆米花的消费量和交通事故的数量也在增加。
实施例3
一项研究发现,自然灾害发生后挺身而出的志愿者越多,损失就越大。这是否意味着志愿者造成了更大的损害?
这不太可能。最可能的原因是自然灾害的规模不同。较大的自然灾害会导致更多的志愿者以及自然灾害造成的损失的增加。
实施例4
研究发现手套销售和滑雪事故密切相关。这是否意味着手套会导致更多滑雪事故?
这不太可能。最可能的原因是潜伏的温度变化。随着气温下降,越来越多的人购买手套,越来越多的人去滑雪。
如何识别隐藏变量
为了发现隐藏的变量,拥有所研究领域的专业知识会有所帮助。通过了解哪些潜在变量可能影响研究中未明确包含的研究变量之间的关系,您也许能够发现潜在的隐藏变量。
识别潜在隐藏变量的另一种方法是检查残差图。如果残差存在趋势(线性或非线性),这可能意味着未包含在研究中的隐藏变量正在以某种方式影响研究变量。
如何消除隐变量风险
在观察性研究中,消除隐藏变量的风险可能非常困难。在大多数情况下,您能做的最好的事情就是简单地识别而不是阻止可能影响研究的潜在隐藏变量。
然而,在实验研究中,通过良好的实验设计可以很大程度上消除隐变量的影响。
例如,假设我们想知道两种药对血压是否有不同的影响。我们知道饮食和吸烟习惯等隐藏变量也会影响血压。因此,我们可以尝试使用随机设计来控制这些隐藏变量。这意味着我们随机分配患者服用第一种或第二种药物。
由于我们将患者随机分组,因此我们可以假设隐藏变量对两组的影响大致相同。这意味着血压的任何差异都可以归因于药物,而不是隐藏变量的影响。