Stata で相関行列を作成する方法


統計では、2 つの変数間の関係を理解しようとすることがよくあります。たとえば、学生の勉強時間と試験での成績との関係を理解したい場合があります。

この関係を定量化する 1 つの方法は、2 つの変数間の線形関連性の尺度である ピアソン相関係数を使用することです -1 から 1 までの値を持ちます。ここで、

  • -1 は、2 つの変数間の完全な負の線形相関を示します。
  • 0 は 2 つの変数間に線形相関がないことを示します
  • 1 は、2 つの変数間の完全な正の線形相関を示します。

相関係数がゼロから離れるほど、2 つの変数間の関係が強くなります。

しかし場合によっては、変数の複数のペア間の相関関係を理解したいことがあります。このような場合、 相関行列を作成できます。これは、変数のいくつかのペアごとの組み合わせ間の相関係数を示す正方形の表です。

このチュートリアルでは、Stata で相関行列を作成する方法を説明します。

Stata で相関行列を作成する方法

corrコマンドを使用すると、Stata の特定のデータセットの相関行列を生成できます。

これを説明するために、コマンド ボックスに次のように入力して、1980 年の国勢調査データを Stata にロードしてみましょう。

https://www.stata-press.com/data/r13/census13 を使用してください

コマンド ボックスに次のように入力すると、データセットの簡単な概要を取得できます。

要約する

これにより、次の表が生成されます。

Stata の相関行列

データセットには 9 つの異なる変数が含まれていることがわかります。データセット内の変数のペアごとの組み合わせごとに相関行列を作成するには、コマンド ボックスに次のように入力します。

間違っています

これにより、次の相関行列が生成されます。

Stata の相関行列の例

表に示されている数値は、変数のペアごとの組み合わせごとのピアソン相関係数を表しています。たとえば、人口の間の相関は-0.0540です。これは、これら 2 つの変数がわずかに負の相関があることを示しています。

各変数はそれ自体と完全に相関しているため、表の対角線に沿った相関はそれぞれ 1.0000 であることに注意してください。

corrコマンドの後に変数を指定することで、データセット内の変数の特定のサブセットのみの相関行列を作成することもできます。たとえば、 Popmedage 、およびregion変数のみの相関行列を作成する方法は次のとおりです。

ポップメディア領域が間違っています

これにより、これら 3 つの変数のみについて次の相関行列が生成されます。

Stata の相関行列の例

また、 pwcorrコマンド ( corrと同じ結果を生成します) とstar()コマンドを使用して、特定の有意レベルで統計的に有意な相関係数の隣に星印を付けることもできます。

たとえば、次のコードは国勢調査データセット内の各変数の相関行列を生成し、α = 0.05 で統計的に有意な相関係数の隣に星を配置します。

pwcorr、スター (.05)

Stata における統計的有意性のある相関行列

表内のいくつかの相関係数が α = 0.05 で統計的に有意であることに注目してください。 α は任意の数値に設定できますが、一般的な選択肢は 0.01、0.05、および 0.10 です。

一般に、α の値が小さいほど、相関係数の統計的有意性は低くなります。たとえば、α = 0.01 と設定するとします。

pwcorr、スター (.01)

Stata の相関行列

相関係数の隣に星印が付いている相関係数がいかに少ないかに注目してください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です