相关性对比协会:有什么区别?


有时可以互换使用的两个术语是相关性关联性。然而,在统计领域,这两个术语的含义略有不同。

特别是,当我们使用相关性这个词时,我们通常谈论的是皮尔逊相关系数。它是两个随机变量XY之间线性关联的度量。它的值介于 -1 和 1 之间,其中:

  • -1 表示两个变量之间完全负线性相关
  • 0 表示两个变量之间不存在线性相关
  • 1 表示两个变量之间存在完全正线性相关

相反,当统计学家使用“关联”一词时,他们可以谈论两个变量之间的任何关系,无论是线性还是非线性。

为了说明这个想法,请考虑以下示例。

可视化与点云的相关性和关联性

我们用两个词来描述两个随机变量之间的相关性:

1个方向

  • 正相关:如果Y随着X 的增加而增加,则两个随机变量具有正相关性。
  • 负相关:如果Y随着X 的增加而减少,则两个随机变量具有负相关性。

2. 实力

  • 低:如果散点图中的点稀疏分散,则两个随机变量的相关性较低。
  • 强:如果散点图中的点紧密分组在一起,则两个随机变量具有很强的相关性。

以下散点图说明了每种相关性的示例:

与相关性相比,关联这个词可以告诉我们两个随机变量之间是否存在关系:线性非线性。

以下散点图说明了一些示例:

相关性与关联性

左上角的散点图说明了两个随机变量之间的二次关系,这意味着两个变量之间存在关联,但不是线性的。

如果我们计算两个变量之间的相关性,它可能接近于零,因为它们之间不存在线性关系。

然而,仅仅知道两个变量之间的相关性为零可能会产生误导,因为它掩盖了存在非线性关系的事实。

相关性对比协会:总结

术语相关性和关联性具有以下相似点和不同点:

相似之处:

  • 这两个术语都用于描述两个随机变量之间是否存在关系。
  • 这两个术语都可以使用散点图来分析两个随机变量之间的关系。

差异:

  • 相关性只能告诉我们两个随机变量是否存在线性关系,而关联性可以告诉我们两个随机变量是否存在线性关系非线性关系。
  • 相关性使用 -1 到 1 之间的数字来量化两个随机变量之间的关系,但关联性不使用特定的数字来量化关系。

其他资源

皮尔逊相关系数简介
点云简介
相关与回归:有什么区别?

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注