Python で点と双系列の相関を計算する方法


点双直列相関は、バイナリ変数 x と連続変数 y の間の関係を測定するために使用されます。

ピアソン相関係数と同様に、点双直列相関係数は -1 から 1 までの値をとります。

  • -1 は、2 つの変数間の完全な負の相関を示します。
  • 0 は 2 つの変数間に相関がないことを示します
  • 1 は、2 つの変数間の完全な正の相関関係を示します。

このチュートリアルでは、Python で 2 つの変数間の点双系列相関を計算する方法を説明します。

例: Python での点と双列の相関

二値変数 x と連続変数 y があるとします。

 x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0]
y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]

scipy.stats ライブラリのpointbiserialr()関数を使用して、2 つの変数間の点と双系列の相関を計算できます。

この関数は、対応する p 値とともに相関係数を返すことに注意してください。

 import scipy.stats as stats

#calculate point-biserial correlation
stats. pointbiserialr (x,y)

PointbiserialrResult(correlation=0.21816, pvalue=0.51928)

点双直列相関係数は0.21816で、対応する p 値は0.51928です。

相関係数が正であることから、変数xが値「1」をとるときの方が、変数xが値「0」をとるときよりも変数yが高い値をとる傾向があることを示している。

この相関関係の p 値は 0.05 以上であるため、この相関関係は統計的に有意ではありません。

この相関関係の計算方法の正確な詳細については、 scipy.stats ドキュメントを参照してください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です