相関
この記事では、2 つの変数間の相関関係の意味、相関係数の計算方法、存在するさまざまな種類の相関関係について説明します。さらに、2 つの変数間の相関値を解釈する方法も示します。
相関関係とは何ですか?
相関関係は、 2 つの変数間の関係の程度を示す統計的尺度です。より具体的には、線形相関を使用して、2 つの異なる変数間の線形相関の程度を決定します。
一方の変数の値を変更すると、もう一方の変数の値も変更される場合、2 つの変数はリンクされます。たとえば、変数 A が増加すると変数 B も増加する場合、変数 A と変数 B の間には相関関係があります。
相関関係の種類
2 つの確率変数間の関係に応じて、次のタイプの線形相関が区別されます。
- 直接相関 (または正の相関) : 一方の変数が増加すると、他方の変数も増加します。
- 逆相関 (または負の相関) : 一方の変数が増加すると、他方の変数は減少し、逆も同様で、一方の変数が減少すると、他方の変数は増加します。
- ゼロ相関 (相関なし) : 2 つの変数間に関係がありません。
これらはさまざまなタイプの線形相関が存在することに留意してください。ただし、2 つの変数間の数学的関係を直線で表すことができず、代わりにたとえ話のようなより複雑な関数を使用する必要がある場合もあります。または対数。この場合、それは非線形相関になります。
相関係数
相関の定義と存在するさまざまな種類の相関を考慮して、この統計値がどのように計算されるかを見てみましょう。
相関係数 は、線形相関係数またはピアソン相関係数とも呼ばれ、2 つの変数間の相関の値です。
2 つの統計変数の相関係数は、変数の共分散と各変数の分散の積の平方根との商に等しくなります。したがって、相関係数の計算式は次のようになります。
母集団の相関係数を計算する場合、相関記号はギリシャ文字の ρ です。ただし、サンプルを基準にして係数を計算する場合は、通常、文字 r が記号として使用されます。
相関インデックスの値は、-1 から +1 までの範囲になります。相関係数の値がどのように解釈されるかを以下で見てみましょう。
相関係数の計算方法の具体的な例は、次のリンクで確認できます。
スピアマンの相関係数やケンドールの相関係数など、他のタイプの相関係数があることに注意してください。しかし、最も一般的なのは間違いなくピアソン相関係数です。
相関関係の解釈
相関係数の値の範囲は -1 ~ +1 です。したがって、相関係数の値に応じて、2 つの変数間の関係が一方向または別の方向にあることを意味します。相関値を解釈する方法は次のとおりです。
- r=-1 : 2 つの変数には完全な負の相関があるため、すべての点がリンクする負の傾きを持つ線を描くことができます。
- -1<r<0 : 2 つの変数間の相関関係は負であるため、一方の変数が増加すると他方の変数は減少します。値が -1 に近づくほど、変数の負の関連性が高くなります。
- r=0 : 2 つの変数間の相関は非常に弱く、実際、それらの間の線形関係はゼロです。これは、変数が非線形関係を持つ可能性があるため、変数が独立していることを意味するものではありません。
- 0<r<1 : 2 つの変数間の相関は正で、値が +1 に近づくほど、変数間の関係が強くなります。この場合、一方の変数の値が増加すると、もう一方の変数の値も増加する傾向があります。
- r=1 : 2 つの変数には完全な正の相関関係があります。つまり、正の線形関係があります。
上の散布図でわかるように、2 つの変数間の相関が強いほど、グラフ上の点の間隔が近くなります。一方、ポイントが非常に離れている場合、これは相関が弱いことを意味します。
2 つの変数間に相関関係がある場合でも、それはそれらの間に因果関係があることを意味するわけではないことに留意してください。つまり、2 つの変数間の相関関係は、一方の変数の変化がもう一方の変数の変化の原因であることを意味するわけではありません。変数。
たとえば、体内での 2 つの異なるホルモンの生成の間に正の関係があることがわかった場合、これは必ずしも、一方のホルモンの増加が他方のホルモンの増加につながることを意味するわけではありません。病気と闘うために両方のホルモンが必要で、したがって両方のホルモンのレベルが同時に上昇するため、体は両方のホルモンを生成している可能性があります。その場合、原因は病気になります。 2 つのホルモン間に因果関係があるかどうかを判断するには、より詳細な研究を実施する必要があります。
相関と回帰
相関と回帰は、どちらも 2 つの変数間の関係を分析するために使用されるため、一般に関連する 2 つの概念です。
相関関係は 2 つの変数間の関係を定量化する統計的尺度ですが、回帰では 2 つの変数を関連付けることができる方程式 (線形回帰の場合は直線になります) を作成する必要があります。
したがって、相関関係は変数間の関係に数値を与えるだけですが、回帰分析を使用すると、一方の変数の値を他方の変数と比較して予測することができます。
一般に、まず相関係数を計算して、変数に相関があるかどうかを分析します。相関関係が有意な場合は、データセットの回帰を実行します。
相関係数と線形回帰で得られる直線の傾きの値を混同することがよくありますが、これらは同等ではありません。
相関行列
相関行列は、位置i,jに変数iとjの間の相関係数を含む行列です。
したがって、相関行列は主対角上の 1 で満たされた正方行列となり、行iと列jの要素は変数iと変数jの間の相関係数の値で構成されます。
したがって、相関行列の式は次のようになります。
金
変数間の相関係数です
そして
相関行列は、どの関係が強いかをすぐに確認できるため、結果を要約したり、複数の変数間の相関関係を同時に比較したりするのに非常に役立ちます。