相关性并不意味着因果关系:5 个具体例子
统计学中经常使用“相关性并不意味着因果关系”这一短语来强调两个变量之间的相关性并不一定意味着一个变量导致另一个变量。
为了更好地理解这个表达式,请考虑以下具体示例。
示例 1:冰淇淋销售和鲨鱼袭击
如果我们每年收集美国每月冰淇淋销量和每月鲨鱼袭击事件的数据,我们会发现这两个变量高度相关。
这是否意味着吃冰淇淋会导致鲨鱼袭击?
不够。最可能的解释是,当外面温暖时,更多的人会吃冰淇淋并在海里游泳,这解释了为什么这两个变量如此高度相关。
尽管冰淇淋销售和鲨鱼袭击高度相关,但两者并不互为因果。
示例 2:精通程度和票房收入
如果我们收集每年大学授予的硕士学位总数和每年产生的总票房收入的数据,我们会发现这两个变量是高度相关的。
这是否意味着颁发更多的硕士学位会导致每年的票房收入增加?
不够。最可能的解释是,世界人口每年都在增加,这意味着每年授予更多的硕士学位,每年去看电影的人数也以大致相同的比例增加。
尽管这两个变量相关,但其中一个变量并不导致另一个变量。
示例 3:与核能生产相关的游泳池溺水事件
如果我们收集每年游泳池溺水总人数和核电站每年产生的能源总量的数据,我们会发现这两个变量是高度相关的。
这是否意味着游泳池溺水事件的增加在某种程度上导致了核电产量的增加?
不完全是。最可能的解释是,世界人口增加了,这意味着更多的人淹死在游泳池里,而核能发电每年都变得更加可行,这就是它增加的原因。
尽管这两个变量高度相关,但其中一个变量并不导致另一个变量。
示例 4:麻疹病例与结婚率的关系
如果我们每年收集美国麻疹病例总数和结婚率的数据,我们会发现这两个变量高度相关。
这是否意味着麻疹病例减少会导致结婚率降低?
不完全是。相反,这两个变量是独立的:现代医学正在导致麻疹病例减少,并且由于各种原因每年结婚的人数减少。
尽管这两个变量高度相关,但其中一个变量并不导致另一个变量。
示例 5:高中毕业生与披萨消费的关系
如果我们每年收集美国高中毕业生总数和披萨总消费量的数据,我们会发现这两个变量高度相关。
这是否意味着越来越多的高中毕业生正在导致美国披萨消费的增加?
不够。最可能的解释是,美国人口随着时间的推移而增加,这意味着拥有高中文凭的人数和消费的披萨总量随着人口的增加而增加。
尽管这两个变量相关,但其中一个变量并不导致另一个变量。
其他资源
以下教程提供了有关关联的其他信息:
皮尔逊相关系数简介
因果关系是否意味着相关性?
相关性对比协会:有什么区别?
什么被认为是“强”相关性?
什么时候应该使用相关性?