二変量解析の簡単な紹介
二変量分析という用語は、2 つの変数の分析を指します。接頭辞「bi」は「2」を意味するので、これを覚えておくとよいでしょう。
二変量解析の目標は、2 つの変数間の関係を理解することです。このタイプの分析を次の分析と比較できます。
- 単変量分析: 1 つの変数の分析。
- 多変量分析: 2 つ以上の変数の分析。
二変量解析を実行するには、次の 3 つの一般的な方法があります。
1.散布図。
2.相関係数。
3.単純な線形回帰。
このチュートリアルでは、2 つの変数(1)勉強に費やした時間、および(2) 20 人の異なる学生が取得した試験の得点に関する情報を含む次のデータ セットを使用して、これらのタイプの二変量分析のそれぞれの例を示します。
1. 点群
散布図は、二変量解析を実行する視覚的な方法を提供します。一方の変数の値を X 軸に、もう一方の変数の値を Y 軸に配置することで、2 つの変数間の関係を視覚化できます。
以下の散布図では、学習時間を X 軸に、試験結果を Y 軸に配置しています。
2 つの変数の間には正の関係があることが明確にわかります。学習時間数が増加するにつれて、試験のスコアも増加する傾向があります。
2. 相関係数
相関係数は、二変量解析を実行する別の方法を提供します。最も一般的なタイプの相関係数は、2 つの変数間の線形関連性の尺度であるピアソン相関係数です。 -1 から 1 までの値を持ちます。ここで、
- -1 は、2 つの変数間の完全な負の線形相関を示します。
- 0 は 2 つの変数間に線形相関がないことを示します
- 1 は、2 つの変数間の完全な正の線形相関を示します。
この単純な指標により、2 つの変数がどのように関連しているかがわかります。実際には、散布図と相関係数を使用して 2 つの変数間の関係を理解し、それらの関係を視覚化して定量化することがよくあります。
3. 単純な線形回帰
二変量分析を実行する 3 番目の方法は、単純な線形回帰を使用することです。
この方法を使用して、1 つの変数を説明変数として選択し、もう 1 つの変数を応答変数として選択します。次に、データセットに最も「適合」する行を見つけます。これを使用して、2 つの変数間の正確な関係を理解できます。
たとえば、上記のデータセットに最適な行は次のとおりです。
試験のスコア = 69.07 + 3.85*(勉強時間)
これは、学習時間が追加されるごとに、試験の平均スコアが 3.85 増加することを意味します。この線形回帰モデルを当てはめることで、学習時間と試験の成績との正確な関係を定量化できます。
結論
二変量分析は、2 つの変数間の関係を理解したいことが多いため、統計学で最もよく使用される分析タイプの 1 つです。
散布図、相関係数、単純な線形回帰を使用すると、2 つの変数間の関係を視覚化し、定量化できます。
多くの場合、これら 3 つの方法は、2 つの変数間の関係の全体像を得るために、分析で一緒に使用されます。したがって、それぞれの方法をよく理解しておくことをお勧めします。