如何手动计算皮尔逊相关系数
皮尔逊相关系数衡量两个变量之间的线性关联。
它始终采用 -1 和 1 之间的值,其中:
- -1 表示两个变量之间完全负线性相关
- 0 表示两个变量之间不存在线性相关
- 1 表示两个变量之间存在完全正线性相关
计算 Pearson 相关系数(表示为r )的公式为:
本教程提供了如何手动计算以下数据集的皮尔逊相关系数的分步示例:
步骤1:计算X和Y的平均值
首先,我们将计算 X 和 Y 值的平均值:
第 2 步:计算平均值之间的差异
接下来,我们将计算每个单独值 X 和 Y 及其各自平均值之间的差异:
步骤 3:计算剩余值
接下来,我们将计算完成皮尔逊相关系数公式所需的剩余值:
第 4 步:计算总和
接下来,我们将计算最后三列的总和:
第5步:计算皮尔逊相关系数
现在我们只需将上一步的总和代入皮尔逊相关系数公式:
Pearson 相关系数为0.947 。
由于该值接近1,表明X和Y呈强正相关。
换句话说,随着 X 值的增加,Y 值也会以高度可预测的方式增加。