相关系数的置信区间


相关系数的置信区间是可能包含具有一定置信水平的总体相关系数的值范围。

本教程解释了以下内容:

  • 创建此类置信区间的动机。
  • 创建此类置信区间的公式。
  • 如何创建此类置信区间的示例。
  • 如何解释这种类型的置信区间。

相关系数的置信区间:动机

为相关系数创建置信区间的原因是为了在估计总体相关系数时捕获我们的不确定性。

例如,假设我们要估计某个县居民身高和体重之间的相关系数。由于该县有数千名居民,如果要四处走访收集每个居民的身高和体重信息,成本高昂且耗时。

相反,我们可以选择一个简单的随机居民样本,并简单地收集有关他们的信息。

人口比例估算示例

由于我们随机选择居民样本,因此无法保证这些样本居民的身高和体重之间的相关系数与较大人群的相关系数完全匹配。

因此,为了捕捉这种不确定性,我们可以创建一个包含一系列值的置信区间,这些值可能包含该县居民身高和体重之间的真实相关系数。

相关系数的置信区间:公式

我们使用以下步骤根据样本大小n和样本相关系数r计算总体相关系数的置信区间。

步骤 1:执行 Fisher 变换。

令 z r = ln((1+r) / (1-r)) / 2

步骤2:找到对数的上限和下限。

令 L = z r – (z 1-α/2 /√ n-3 )

设 U = z r + (z 1-α/2 /√ n-3 )

步骤 3:求置信区间。

最终的置信区间可以使用以下公式找到:

置信区间 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]

相关系数的置信区间:示例

假设我们要估计某个县居民身高和体重之间的相关系数。我们随机抽取了 30 名居民,发现以下信息:

  • 样本量n = 30
  • 身高和体重的相关系数r = 0.56

以下是如何找到总体相关系数的 95% 置信区间:

步骤 1:执行 Fisher 变换。

令 z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0.6328

步骤2:找到对数的上限和下限。

令 L = z r – (z 1-α/2 /√ n-3 ) = 0.6328 – (1.96 /√ 30-3 ) = 0.2556

令 U = z r + (z 1-α/2 /√ n-3 ) = 0.6328 + (1.96 /√ 30-3 ) = 1.01

步骤 3:求置信区间。

置信区间 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]

置信区间 = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [. 2502,.7658]

注意:您还可以使用相关系数计算器的置信区间来查找此置信区间。

相关系数的置信区间:解释

我们解释置信区间的方式是:

置信区间 [.2502, .7658] 包含该县居民身高和体重之间的真实人口相关系数的可能性为 95%。

同一件事的另一种说法是,真正的总体相关系数只有 5% 的机会位于 95% 置信区间之外。

也就是说,该县居民身高和体重之间的真实人口相关系数小于0.2502或大于0.7658的可能性只有5%。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注