Stata の相関関係: ピアソン、スピアマン、ケンダル


統計学において、相関とは、2 つの変数間の関係の強さと方向を指します。相関係数の値の範囲は -1 ~ 1 で、-1 は完全な負の関係を示し、0 は関係がないことを示し、1 は完全な正の関係を示します。

相関関係を測定するには、次の 3 つの一般的な方法があります。

ピアソン相関: 2 つの連続変数間の相関を測定するために使用されます。 (身長や体重など)

スピアマン相関: 2 つの分類された変数間の相関を測定するために使用されます。 (例: クラス内での生徒の数学試験のスコアのランキングと科学試験のスコアのランキング)

Kendall の相関関係: Spearman の相関関係を使用したいが、サンプル サイズが小さく、関連するランキングが多数ある場合に使用されます。

このチュートリアルでは、Stata で 3 種類の相関関係を見つける方法を説明します。

データのロード

次の各例では、 autoというデータセットを使用します。コマンド ボックスに次のように入力すると、このデータセットをロードできます。

https://www.stata-press.com/data/r13/auto を使用してください

コマンド ボックスに次のように入力すると、データセットの概要を簡単に把握できます。

要約する

Stata のコマンド例を要約する

データセットには合計 12 個の変数があることがわかります。

Stata でピアソン相関を見つける方法

pwcorrコマンドを使用して、重み変数と長さ変数の間の ピアソン相関係数を見つけることができます。

pwcorr 重量の長さ

Stata のピアソン相関

これら 2 つの変数間のピアソン相関係数は0.9460です。この相関係数が有意かどうかを判断するには、 sigコマンドを使用して p の値を見つけることができます。

pwcorr 重みの長さ、sig

Stata におけるピアソン相関の意味

p 値は0.000です。これは 0.05 未満であるため、これら 2 つの変数間の相関関係は統計的に有意です。

複数の変数のピアソン相関係数を見つけるには、 pwcorrコマンドの後に変数のリストを入力するだけです。

pwcorr 重量長さ変位、sig

Stata の複数の変数のピアソン相関

結果を解釈する方法は次のとおりです。

  • 体重と長さの間のピアソン相関 = 0.9460 | p値 = 0.000
  • 重量と変位の間のピアソン相関 = 0.8949 | p値 = 0.000
  • 変位と長さの間のピアソン相関 = 0.8351 | p値 = 0.000

Stata でスピアマンの相関関係を見つける方法

spearmanコマンドを使用して、変数trunkrep78の間のスピアマン相関係数を見つけることができます。

ランストランク担当者78

Stata のスピアマン相関

結果を解釈する方法は次のとおりです。

  • 観測値の数:これは、スピアマン相関係数を計算するために使用されるペアごとの観測値の数です。 rep78変数の一部の値が欠落しているため、Stata はペアごとに (完全な 74 個ではなく) 69 個の観測値のみを使用しました。
  • スピアマンのロー:これはスピアマン相関係数です。この場合、それは -0.2235 であり、2 つの変数間に負の相関があることを示します。一方が増加すると、他方は減少する傾向があります。
  • 確率 > |t| :これは仮説検定に関連付けられた p 値です。この場合、p 値は 0.0649 で、α = 0.05 では 2 つの変数間に統計的に有意な相関がないことを示します。

spearmanコマンドの後にさらに変数を入力するだけで、複数の変数のスピアマン相関係数を見つけることができます。 stats(rho p)コマンドを使用して、各ペア相関の相関係数と対応する p 値を見つけることができます。

スピアマン トランク担当者 78 ギア比、統計 (rho p)

Stata の複数の変数のスピアマン相関

結果を解釈する方法は次のとおりです。

  • トランクと rep78 の間のスピアマン相関 = -0.2235 | p値 = 0.0649
  • トランクとギア比間のスピアマン相関 = -0.5187 | p値 = 0.0000
  • gear_ratio と rep78 の間のスピアマン相関 = 0.4275 | p値 = 0.0002

Stata で Kendall の相関関係を見つける方法

ktauコマンドを使用して、 trunk変数とrep78変数の間のKendall 相関係数を見つけることができます。

ktau トランク担当 78

Stata における Kendall の相関関係

結果を解釈する方法は次のとおりです。

  • 観測値の数:これは、ケンダル相関係数を計算するために使用されるペアごとの観測値の数です。 rep78変数の一部の値が欠落しているため、Stata はペアごとに (完全な 74 個ではなく) 69 個の観測値のみを使用しました。
  • Kendall の Tau-b:これは 2 つの変数間の Kendall の相関係数です。同点の場合は tau-b が調整を行うため、通常は tau-a の代わりにこの値を使用します。この場合、tau-b = -0.1752 であり、2 つの変数間の負の相関関係を示しています。
  • 確率 > |z| :これは仮説検定に関連付けられた p 値です。この場合、p 値は 0.0662 で、α = 0.05 では 2 つの変数間に統計的に有意な相関がないことを示します。

ktauコマンドの後にさらに変数を入力するだけで、複数の変数のケンドールの相関係数を見つけることができます。 stats(taub p)コマンドを使用して、各ペア相関の相関係数と対応する p 値を見つけることができます。

ktau トランク rep78 ギア比、統計 (taub p)

Stata の複数の変数に対する Kendall のタウ

  • トランクと rep78 の間の Kendall 相関 = -0.1752 | p値 = 0.0662
  • Kendall の体幹とギア比の相関 = -0.3753 | p値 = 0.0000
  • gear_ratio と rep78 の間の Kendall 相関 = 0.3206 | p値 = 0.0006

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です