第三变量问题:定义和示例
在统计学中,当观察到的两个变量之间的相关性实际上可以用尚未考虑的第三个变量来解释时,就会出现第三个变量问题。
当不考虑第三个变量时,所研究的两个变量之间的相关性可能会产生误导,甚至导致混乱。
本教程提供了不同上下文中第三变量问题的几个示例。
示例 1:狗和消防栓
一位研究人员观察到,拥有更多消防栓的城市往往也有更多的狗。
然而,这两个变量只是相关的,因为它们都与第三个变量有很强的相关性:人口规模。
大城市往往有更多的消防栓和更多的狗。相反,较小的城镇往往有较少的消防栓和较少的狗。
示例 2:冰淇淋销售和鲨鱼袭击
研究人员发现冰淇淋销售与鲨鱼袭击呈强烈正相关。
然而,这两个变量只是相关的,因为它们都与第三个变量:温度有很强的相关性。
当天气变暖时,更多的人购买冰淇淋,更多的人在海里游泳,这解释了为什么冰淇淋销售和鲨鱼袭击的价值往往会在一年中的同一时间增加。
示例 3:志愿者和自然灾害
一项研究发现,自然灾害发生后挺身而出的志愿者越多,损失就越大。
然而,这两个变量只是相关的,因为它们都与第三个变量有很强的相关性:自然灾害的严重程度。
较大的自然灾害与造成的损失越大以及志愿者人数的增加密切相关。