相関係数の信頼区間
相関係数の信頼区間は、一定の信頼レベルで母集団相関係数が含まれる可能性が高い値の範囲です。
このチュートリアルでは次について説明します。
- このタイプの信頼区間を作成する動機。
- このタイプの信頼区間を作成するための式。
- このタイプの信頼区間を作成する方法の例。
- このタイプの信頼区間をどのように解釈するか。
相関係数の信頼区間: モチベーション
相関係数の信頼区間を作成する理由は、母集団相関係数を推定する際の不確実性を把握するためです。
たとえば、特定の郡の住民の身長と体重の間の相関係数を推定するとします。郡内には何千人もの住民がいるため、各住民の身長と体重に関する情報を集めて回るのは費用と時間がかかりすぎます。
代わりに、 単純に無作為に住民のサンプルを選択し、彼らに関する情報を収集することもできます。
住民のサンプルを無作為に選択しているため、これらのサンプリングされた住民の身長と体重の間の相関係数が、より大きな母集団の相関係数と正確に一致するという保証はありません。
したがって、この不確実性を捉えるために、その郡の住民の身長と体重の間の真の相関係数が含まれる可能性が高い値の範囲を含む信頼区間を作成できます。
相関係数の信頼区間: 式
次の手順を使用して、サンプル サイズnとサンプル相関係数rに基づいて母集団相関係数の信頼区間を計算します。
ステップ 1: フィッシャー変換を実行します。
z r = ln((1+r) / (1-r)) / 2 とします。
ステップ 2: ログの上限と下限を見つけます。
L = z r – (z 1-α/2 /√ n-3 ) とします。
U = z r + (z 1-α/2 /√ n-3 ) とします。
ステップ 3: 信頼区間を見つけます。
最終的な信頼区間は、次の式を使用して求めることができます。
信頼区間 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
相関係数の信頼区間: 例
特定の郡の住民の身長と体重の間の相関係数を推定したいとします。 30 人の居住者から無作為にサンプルを選択し、次の情報を見つけます。
- サンプルサイズn = 30
- 身長と体重の相関係数r = 0.56
母集団相関係数の 95% 信頼区間を求める方法は次のとおりです。
ステップ 1: フィッシャー変換を実行します。
z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0.6328 とします。
ステップ 2: ログの上限と下限を見つけます。
L = z r – (z 1-α/2 /√ n-3 ) = 0.6328 – (1.96 /√ 30-3 ) = 0.2556とします。
U = z r + (z 1-α/2 /√ n-3 ) = 0.6328 + (1.96 /√ 30-3 ) = 1.01 とします。
ステップ 3: 信頼区間を見つけます。
信頼区間 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
信頼区間 = [(e 2(.2556) -1)/(e 2(.2556) +1)、(e 2(1.01) -1)/(e 2(1.01) +1)] = [。 2502、.7658]
注:この信頼区間は、「相関係数計算ツールの信頼区間」を使用して見つけることもできます。
相関係数の信頼区間: 解釈
信頼区間を解釈する方法は次のとおりです。
[.2502, .7658] の信頼区間には、その郡の住民の身長と体重の間の真の人口相関係数が含まれる確率が 95% あります。
同じことを別の言い方で言えば、真の母集団相関係数が 95% 信頼区間の外にある可能性は 5% しかないということです。
つまり、この郡の住民の身長と体重の間の真の人口相関係数が 0.2502 未満であるか、0.7658 を超える確率は 5% のみです。