Cara menghitung korelasi titik-biserial dengan python
Korelasi titik-biserial digunakan untuk mengukur hubungan antara variabel biner, x, dan variabel kontinu, y.
Mirip dengan koefisien korelasi Pearson , koefisien korelasi titik-biserial mengambil nilai antara -1 dan 1 dimana:
- -1 menunjukkan korelasi negatif sempurna antara dua variabel
- 0 menunjukkan tidak ada korelasi antara dua variabel
- 1 menunjukkan korelasi positif sempurna antara dua variabel
Tutorial ini menjelaskan cara menghitung korelasi titik-biserial antara dua variabel dengan Python.
Contoh: korelasi titik-biserial dengan Python
Misalkan kita mempunyai variabel biner, x, dan variabel kontinu, y:
x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0] y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]
Kita dapat menggunakan fungsi pointbiserialr() dari perpustakaan scipy.stats untuk menghitung korelasi titik-biserial antara dua variabel.
Perhatikan bahwa fungsi ini mengembalikan koefisien korelasi beserta nilai p yang sesuai:
import scipy.stats as stats #calculate point-biserial correlation stats. pointbiserialr (x,y) PointbiserialrResult(correlation=0.21816, pvalue=0.51928)
Koefisien korelasi titik-biserial adalah 0,21816 dan nilai p yang sesuai adalah 0,51928 .
Karena koefisien korelasinya bernilai positif, hal ini menunjukkan bahwa ketika variabel x bernilai “1”, maka variabel y cenderung mengambil nilai lebih tinggi dibandingkan jika variabel x bernilai “0”.
Karena nilai p dari korelasi ini tidak kurang dari 0,05, maka korelasi ini tidak signifikan secara statistik.
Anda dapat menemukan detail pasti tentang bagaimana korelasi ini dihitung dalam dokumentasi scipy.stats.