Cara menghitung korelasi titik-biserial dengan python


Korelasi titik-biserial digunakan untuk mengukur hubungan antara variabel biner, x, dan variabel kontinu, y.

Mirip dengan koefisien korelasi Pearson , koefisien korelasi titik-biserial mengambil nilai antara -1 dan 1 dimana:

  • -1 menunjukkan korelasi negatif sempurna antara dua variabel
  • 0 menunjukkan tidak ada korelasi antara dua variabel
  • 1 menunjukkan korelasi positif sempurna antara dua variabel

Tutorial ini menjelaskan cara menghitung korelasi titik-biserial antara dua variabel dengan Python.

Contoh: korelasi titik-biserial dengan Python

Misalkan kita mempunyai variabel biner, x, dan variabel kontinu, y:

 x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0]
y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]

Kita dapat menggunakan fungsi pointbiserialr() dari perpustakaan scipy.stats untuk menghitung korelasi titik-biserial antara dua variabel.

Perhatikan bahwa fungsi ini mengembalikan koefisien korelasi beserta nilai p yang sesuai:

 import scipy.stats as stats

#calculate point-biserial correlation
stats. pointbiserialr (x,y)

PointbiserialrResult(correlation=0.21816, pvalue=0.51928)

Koefisien korelasi titik-biserial adalah 0,21816 dan nilai p yang sesuai adalah 0,51928 .

Karena koefisien korelasinya bernilai positif, hal ini menunjukkan bahwa ketika variabel x bernilai “1”, maka variabel y cenderung mengambil nilai lebih tinggi dibandingkan jika variabel x bernilai “0”.

Karena nilai p dari korelasi ini tidak kurang dari 0,05, maka korelasi ini tidak signifikan secara statistik.

Anda dapat menemukan detail pasti tentang bagaimana korelasi ini dihitung dalam dokumentasi scipy.stats.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *