Cara menghitung korelasi peringkat spearman dengan python
Dalam statistik, korelasi mengacu pada kekuatan dan arah hubungan antara dua variabel. Nilai koefisien korelasi dapat berkisar antara -1 hingga 1, dengan interpretasi sebagai berikut:
- -1 : hubungan negatif sempurna antara dua variabel
- 0: tidak ada hubungan antara dua variabel
- 1: hubungan positif sempurna antara dua variabel
Jenis korelasi khusus disebut korelasi peringkat Spearman , yang digunakan untuk mengukur korelasi antara dua variabel peringkat. (misalnya, peringkat nilai ujian matematika siswa relatif terhadap peringkat nilai ujian sains di suatu kelas).
Tutorial ini menjelaskan cara menghitung korelasi peringkat Spearman antara dua variabel dengan Python
Contoh: Korelasi peringkat Spearman dengan Python
Misalkan kita memiliki DataFrame panda berikut yang berisi nilai ujian matematika dan nilai ujian sains 10 siswa di kelas tertentu:
import pandas as pd #createDataFrame df = pd. DataFrame ({'student': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'math': [70, 78, 90, 87, 84, 86, 91, 74, 83, 85], 'science': [90, 94, 79, 86, 84, 83, 88, 92, 76, 75]})
Untuk menghitung korelasi Spearman Rank antara nilai matematika dan sains, kita dapat menggunakan fungsi spearmanr() di scipy.stats :
from scipy. stats import spearmanr
#calculate Spearman Rank correlation and corresponding p-value
rho, p = spearmanr(df[' math '], df[' science '])
#print Spearman rank correlation and p-value
print (rho)
-0.41818181818181815
print (p)
0.22911284098281892
Dari hasilnya, kita dapat melihat bahwa korelasi peringkat Spearman adalah -0,41818 dan nilai p yang sesuai adalah 0,22911 .
Hal ini menunjukkan adanya korelasi negatif antara nilai ujian IPA dan matematika.
Namun, karena nilai p korelasi tidak kurang dari 0,05, maka korelasi tersebut tidak signifikan secara statistik.
Perhatikan bahwa kita juga dapat menggunakan sintaks berikut untuk mengekstrak koefisien korelasi atau nilai p:
#extract Spearman Rank correlation coefficient
spearmanr(df[' math '], df[' science '])[0]
-0.41818181818181815
#extract p-value of Spearman Rank correlation coefficient
spearmanr(df[' math '], df[' science '])[1]
0.22911284098281892
Sumber daya tambahan
Cara menghitung korelasi rank Spearman di R
Cara Menghitung Korelasi Rank Spearman di Excel
Cara menghitung korelasi peringkat Spearman di Stata