Python で点と双系列の相関を計算する方法
点双直列相関は、バイナリ変数 x と連続変数 y の間の関係を測定するために使用されます。
ピアソン相関係数と同様に、点双直列相関係数は -1 から 1 までの値をとります。
- -1 は、2 つの変数間の完全な負の相関を示します。
- 0 は 2 つの変数間に相関がないことを示します
- 1 は、2 つの変数間の完全な正の相関関係を示します。
このチュートリアルでは、Python で 2 つの変数間の点双系列相関を計算する方法を説明します。
例: Python での点と双列の相関
二値変数 x と連続変数 y があるとします。
x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0] y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]
scipy.stats ライブラリのpointbiserialr()関数を使用して、2 つの変数間の点と双系列の相関を計算できます。
この関数は、対応する p 値とともに相関係数を返すことに注意してください。
import scipy.stats as stats #calculate point-biserial correlation stats. pointbiserialr (x,y) PointbiserialrResult(correlation=0.21816, pvalue=0.51928)
点双直列相関係数は0.21816で、対応する p 値は0.51928です。
相関係数が正であることから、変数xが値「1」をとるときの方が、変数xが値「0」をとるときよりも変数yが高い値をとる傾向があることを示している。
この相関関係の p 値は 0.05 以上であるため、この相関関係は統計的に有意ではありません。
この相関関係の計算方法の正確な詳細については、 scipy.stats ドキュメントを参照してください。