Python'da nokta-çift serili korelasyon nasıl hesaplanır


Nokta-çift serili korelasyon, ikili değişken x ile sürekli değişken y arasındaki ilişkiyi ölçmek için kullanılır.

Pearson korelasyon katsayısına benzer şekilde, nokta-çift serili korelasyon katsayısı -1 ile 1 arasında bir değer alır; burada:

  • -1, iki değişken arasında tamamen negatif bir korelasyon olduğunu gösterir
  • 0, iki değişken arasında korelasyon olmadığını gösterir
  • 1, iki değişken arasında mükemmel pozitif bir korelasyon olduğunu gösterir

Bu eğitimde Python’da iki değişken arasındaki nokta-çift serili korelasyonun nasıl hesaplanacağı açıklanmaktadır.

Örnek: Python’da nokta-çift serili korelasyon

Bir ikili değişkenimiz (x) ve bir sürekli değişkenimiz (y) olduğunu varsayalım:

 x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0]
y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]

İki değişken arasındaki nokta-çift serili korelasyonu hesaplamak için scipy.stats kütüphanesindeki pointbiserialr() fonksiyonunu kullanabiliriz.

Bu fonksiyonun karşılık gelen p değeriyle birlikte bir korelasyon katsayısı döndürdüğünü unutmayın:

 import scipy.stats as stats

#calculate point-biserial correlation
stats. pointbiserialr (x,y)

PointbiserialrResult(correlation=0.21816, pvalue=0.51928)

Nokta-çift serili korelasyon katsayısı 0,21816’dır ve karşılık gelen p değeri 0,51928’dir .

Korelasyon katsayısının pozitif olması, x değişkeninin “1” değerini alması durumunda y değişkeninin, x değişkeninin “0” değerini almasına göre daha yüksek değerler alma eğiliminde olduğunu gösterir.

Bu korelasyonun p değeri 0,05’ten küçük olmadığı için bu korelasyon istatistiksel olarak anlamlı değildir.

Bu korelasyonun nasıl hesaplandığına ilişkin tam ayrıntıları scipy.stats belgelerinde bulabilirsiniz .

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir