Python'da nokta-çift serili korelasyon nasıl hesaplanır
Nokta-çift serili korelasyon, ikili değişken x ile sürekli değişken y arasındaki ilişkiyi ölçmek için kullanılır.
Pearson korelasyon katsayısına benzer şekilde, nokta-çift serili korelasyon katsayısı -1 ile 1 arasında bir değer alır; burada:
- -1, iki değişken arasında tamamen negatif bir korelasyon olduğunu gösterir
- 0, iki değişken arasında korelasyon olmadığını gösterir
- 1, iki değişken arasında mükemmel pozitif bir korelasyon olduğunu gösterir
Bu eğitimde Python’da iki değişken arasındaki nokta-çift serili korelasyonun nasıl hesaplanacağı açıklanmaktadır.
Örnek: Python’da nokta-çift serili korelasyon
Bir ikili değişkenimiz (x) ve bir sürekli değişkenimiz (y) olduğunu varsayalım:
x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0] y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]
İki değişken arasındaki nokta-çift serili korelasyonu hesaplamak için scipy.stats kütüphanesindeki pointbiserialr() fonksiyonunu kullanabiliriz.
Bu fonksiyonun karşılık gelen p değeriyle birlikte bir korelasyon katsayısı döndürdüğünü unutmayın:
import scipy.stats as stats #calculate point-biserial correlation stats. pointbiserialr (x,y) PointbiserialrResult(correlation=0.21816, pvalue=0.51928)
Nokta-çift serili korelasyon katsayısı 0,21816’dır ve karşılık gelen p değeri 0,51928’dir .
Korelasyon katsayısının pozitif olması, x değişkeninin “1” değerini alması durumunda y değişkeninin, x değişkeninin “0” değerini almasına göre daha yüksek değerler alma eğiliminde olduğunu gösterir.
Bu korelasyonun p değeri 0,05’ten küçük olmadığı için bu korelasyon istatistiksel olarak anlamlı değildir.
Bu korelasyonun nasıl hesaplandığına ilişkin tam ayrıntıları scipy.stats belgelerinde bulabilirsiniz .