何が「弱者」とみなされるのか。相関?
統計では、2 つの変数が互いにどのように関係しているかを理解しようとすることがよくあります。たとえば、次のことを知りたいと思うかもしれません。
- 学生の勉強時間と試験の成績との間にはどのような関係があるのでしょうか?
- 外気温とフードトラックで販売されるアイスクリームバーの数の間にはどのような関係があるのでしょうか?
- 広告に費やされる金額と特定のビジネスから得られる総収益の間にはどのような関係がありますか?
各シナリオでは、2 つの変数間の関係を理解したいと考えています。
2 つの変数間の関係を定量化する最も一般的な方法の 1 つは、2 つの変数間の線形関連性の尺度である ピアソン相関係数を使用することです。
常に -1 から 1 までの値を取ります。
- -1 は、2 つの変数間の完全な負の線形相関を示します。
- 0 は 2 つの変数間に線形相関がないことを示します
- 1 は、2 つの変数間の完全な正の線形相関を示します。
多くの場合rで表されるこの数値は、2 つの変数間の関係の強さを理解するのに役立ちます。 r がゼロに近づくほど、2 つの変数間の関係は弱くなります。
2 つの変数には弱い正の相関または弱い負の相関がある可能性があることに注意することが重要です。
弱い正の相関: 1 つの変数が増加すると、他の変数も同様に増加する傾向がありますが、その相関関係は弱いか信頼性が低いだけです。
低い負の相関: 1 つの変数が増加すると、もう 1 つの変数は減少する傾向がありますが、その程度は弱いか信頼性が低くなります。
次の表は、 rの値に基づいて 2 つの変数間の関係の強さを解釈するための経験則を示しています。
rの絶対値 | 関係の強さ |
---|---|
r < 0.25 | 関係なし |
0.25 < r < 0.5 | 弱い関係 |
0.5 < r < 0.75 | 適度な関係 |
r > 0.75 | 強い関係 |
rの絶対値が 0.25 ~ 0.5 の場合、2 つの変数間の相関関係は低いと見なされます。
ただし、「弱い」相関の定義は分野によって異なる場合があります。
医学
医療分野では、「弱い」関係の定義ははるかに低いことがよくあります。特定の薬の服用と心臓発作の軽減との関係がr = 0.2 である場合、これは他の分野では「関係がない」と考えられるかもしれませんが、医学では十分に重要であり、心臓発作のリスクを軽減するために薬を服用する価値はあります。 。心臓発作を起こしています。
人事
人事などの分野では、低い相関関係もより頻繁に使用されます。たとえば、大学の GPA と仕事のパフォーマンスの相関関係は、およそr = 0.16であることが示されています。これはかなり低いですが、企業が少なくとも面接プロセス中に考慮する必要があるほど重要です。
テクノロジー
テクノロジー分野では、変数間の相関関係が「低い」とみなされるためには、はるかに高い必要がある場合があります。たとえば、ある企業が自動運転車を開発し、その車の方向転換の判断と事故を回避する確率との相関関係がr = 0.95である場合、これは「弱い」相関関係と見なすことができ、おそらく車が運転するには弱すぎると考えられます。間違った決定は致命的となる可能性があるため、安全であると考えられます。
散布図を使用して相関関係を視覚化する
2 つの変数間の相関係数を計算する場合、散布図を作成して相関関係を視覚化すると便利です。
特に、点群には次の 2 つの利点があります。
1. 散布図は、相関係数に影響を与える外れ値を特定するのに役立ちます。
極端な外れ値は相関係数に大きな影響を与える可能性があります。以下の例を考えてみましょう。変数XとYのピアソン相関係数はr = 0.91です。
ここで、最初のデータ ポイントをさらに大きく変更すると想像してください。相関係数は突然r = 0.29になります。
この 1 つのデータ ポイントにより、相関係数が強い正の関係から弱い正の関係に変化します。
(2) 散布図は、変数間の非線形関係を特定するのに役立ちます。
ピアソン相関係数は、2 つの変数が線形関係にあるかどうかを簡単に示します。しかし、たとえピアソン相関係数が 2 つの変数に相関関係がないことを示しているとしても、それらには依然としてある種の非線形関係がある可能性があります。
たとえば、相関関係がr = 0.00である変数XとYの間の以下の散布図を考えてみましょう。
変数には明らかに線形関係はありませんが、非線形関係はあります。y 値は単に x 値を二乗したものです。
相関係数だけではこの関係を検出できませんが、散布図では検出できます。
結論
要約すれば:
1.一般に、0.25 と 0.5 の間の相関係数は、2 つの変数間の「弱い」相関とみなされます。
2.この経験則は地域によって異なる場合があります。たとえば、医療分野では技術分野に比べて相関がはるかに低いとみなされる可能性があります。何が相関性が低いとみなされるかを判断するには、必ず対象分野の専門知識を活用してください。
3.相関係数を使用して 2 つの変数間の関係を説明する場合、散布図を作成すると、データ セット内の外れ値や潜在的な非線形関係を特定できるようになります。