如何手动计算皮尔逊相关系数


皮尔逊相关系数衡量两个变量之间的线性关联。

它始终采用 -1 和 1 之间的值,其中:

  • -1 表示两个变量之间完全负线性相关
  • 0 表示两个变量之间不存在线性相关
  • 1 表示两个变量之间存在完全正线性相关

计算 Pearson 相关系数(表示为r )的公式为:

资料来源: 维基百科

本教程提供了如何手动计算以下数据集的皮尔逊相关系数的分步示例:

步骤1:计算X和Y的平均值

首先,我们将计算 X 和 Y 值的平均值:

第 2 步:计算平均值之间的差异

接下来,我们将计算每个单独值 X 和 Y 及其各自平均值之间的差异:

步骤 3:计算剩余值

接下来,我们将计算完成皮尔逊相关系数公式所需的剩余值:

第 4 步:计算总和

接下来,我们将计算最后三列的总和:

第5步:计算皮尔逊相关系数

现在我们只需将上一步的总和代入皮尔逊相关系数公式:

手工皮尔逊相关系数

Pearson 相关系数为0.947

由于该值接近1,表明X和Y呈强正相关。

换句话说,随着 X 值的增加,Y 值也会以高度可预测的方式增加。

其他资源

皮尔逊相关系数简介
如何找到相关系数的置信区间

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注