相关性对比协会:有什么区别?
有时可以互换使用的两个术语是相关性和关联性。然而,在统计领域,这两个术语的含义略有不同。
特别是,当我们使用相关性这个词时,我们通常谈论的是皮尔逊相关系数。它是两个随机变量X和Y之间线性关联的度量。它的值介于 -1 和 1 之间,其中:
- -1 表示两个变量之间完全负线性相关
- 0 表示两个变量之间不存在线性相关
- 1 表示两个变量之间存在完全正线性相关
相反,当统计学家使用“关联”一词时,他们可以谈论两个变量之间的任何关系,无论是线性还是非线性。
为了说明这个想法,请考虑以下示例。
可视化与点云的相关性和关联性
我们用两个词来描述两个随机变量之间的相关性:
1个方向
- 正相关:如果Y随着X 的增加而增加,则两个随机变量具有正相关性。
- 负相关:如果Y随着X 的增加而减少,则两个随机变量具有负相关性。
2. 实力
- 低:如果散点图中的点稀疏分散,则两个随机变量的相关性较低。
- 强:如果散点图中的点紧密分组在一起,则两个随机变量具有很强的相关性。
以下散点图说明了每种相关性的示例:
与相关性相比,关联这个词可以告诉我们两个随机变量之间是否存在关系:线性或非线性。
以下散点图说明了一些示例:
左上角的散点图说明了两个随机变量之间的二次关系,这意味着两个变量之间存在关联,但不是线性的。
如果我们计算两个变量之间的相关性,它可能接近于零,因为它们之间不存在线性关系。
然而,仅仅知道两个变量之间的相关性为零可能会产生误导,因为它掩盖了存在非线性关系的事实。
相关性对比协会:总结
术语相关性和关联性具有以下相似点和不同点:
相似之处:
- 这两个术语都用于描述两个随机变量之间是否存在关系。
- 这两个术语都可以使用散点图来分析两个随机变量之间的关系。
差异:
- 相关性只能告诉我们两个随机变量是否存在线性关系,而关联性可以告诉我们两个随机变量是否存在线性关系或非线性关系。
- 相关性使用 -1 到 1 之间的数字来量化两个随机变量之间的关系,但关联性不使用特定的数字来量化关系。