Python'da spearman sıra korelasyonu nasıl hesaplanır?


İstatistikte korelasyon , iki değişken arasındaki ilişkinin gücünü ve yönünü ifade eder. Bir korelasyon katsayısının değeri, aşağıdaki yorumlara göre -1 ile 1 arasında değişebilir:

  • -1: iki değişken arasında mükemmel bir negatif ilişki
  • 0: iki değişken arasında ilişki yok
  • 1: iki değişken arasında mükemmel bir pozitif ilişki

Özel bir korelasyon türü, iki sıralı değişken arasındaki korelasyonu ölçmek için kullanılan Spearman’ın sıra korelasyonu olarak adlandırılır. (örneğin, bir öğrencinin matematik sınavı puanının, sınıftaki fen bilimleri sınavı puanına göre sıralaması).

Bu eğitimde Python’da iki değişken arasındaki Spearman sıra korelasyonunun nasıl hesaplanacağı açıklanmaktadır.

Örnek: Python’da Spearman sıra korelasyonu

Belirli bir sınıftaki 10 öğrencinin matematik sınav puanı ve fen sınavı puanını içeren aşağıdaki pandalar DataFrame’e sahip olduğumuzu varsayalım :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({'student': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   'math': [70, 78, 90, 87, 84, 86, 91, 74, 83, 85],
                   'science': [90, 94, 79, 86, 84, 83, 88, 92, 76, 75]})

Matematik ve fen bilimleri puanları arasındaki Spearman Rank korelasyonunu hesaplamak için scipy.stats dosyasındaki spearmanr() işlevini kullanabiliriz:

 from scipy. stats import spearmanr

#calculate Spearman Rank correlation and corresponding p-value
rho, p = spearmanr(df[' math '], df[' science '])

#print Spearman rank correlation and p-value
print (rho)

-0.41818181818181815

print (p)

0.22911284098281892

Sonuçtan Spearman sıra korelasyonunun -0,41818 ve buna karşılık gelen p değerinin 0,22911 olduğunu görebiliriz.

Bu durum fen ve matematik sınav puanları arasında negatif bir ilişkinin olduğunu göstermektedir.

Ancak korelasyonun p değeri 0,05’ten küçük olmadığı için korelasyon istatistiksel olarak anlamlı değildir.

Korelasyon katsayısını veya p değerini basitçe çıkarmak için aşağıdaki sözdizimini de kullanabileceğimizi unutmayın:

 #extract Spearman Rank correlation coefficient
spearmanr(df[' math '], df[' science '])[0]

-0.41818181818181815

#extract p-value of Spearman Rank correlation coefficient
spearmanr(df[' math '], df[' science '])[1] 

0.22911284098281892

Ek kaynaklar

R’de Spearman sıralama korelasyonu nasıl hesaplanır
Excel’de Spearman Sıra Korelasyonu Nasıl Hesaplanır?
Stata’da Spearman sıralama korelasyonu nasıl hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir