Pandas'ta iki sütun arasındaki korelasyon nasıl hesaplanır?


Bir pandas DataFrame’deki iki sütun arasındaki korelasyonu hesaplamak için aşağıdaki sözdizimini kullanabilirsiniz:

 df[' column1 ']. corr (df[' column2 '])

Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: İki sütun arasındaki korelasyonu hesaplayın

Aşağıdaki kod, bir pandas DataFrame’deki sütunlar arasındaki korelasyonun nasıl hesaplanacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view first five rows of DataFrame
df. head ()

        points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

#calculate correlation between points and assists
df[' points ']. corr (df[' assists '])

-0.359384

Korelasyon katsayısı -0,359’dur . Bu korelasyon negatif olduğundan, bu bize sayı ve asistlerin negatif korelasyona sahip olduğunu gösteriyor.

Yani puan sütunundaki değerler arttıkça asist sütunundaki değerler düşme eğilimi gösteriyor.

Örnek 2: Korelasyonun Önemini Hesaplayın

Bir korelasyon katsayısının istatistiksel olarak anlamlı olup olmadığını belirlemek için SciPy kütüphanesindeki pearsonr(x, y) fonksiyonunu kullanabilirsiniz.

Aşağıdaki kod bu işlevin pratikte nasıl kullanılacağını gösterir:

 import pandas as pd
from scipy. stats import pearsonr

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#calculate p-value of correlation coefficient between points and assists
pearsonr(df[' points '], df[' assists '])

(-0.359384, 0.38192)

Çıktının ilk değeri korelasyon katsayısını (-0,359384) görüntüler ve ikinci değer, bu korelasyon katsayısıyla ilişkili p değerini (0,38192) görüntüler.

P değeri α = 0,05’ten küçük olmadığından, puanlar ve asistler arasındaki korelasyonun istatistiksel olarak anlamlı olmadığı sonucuna varabiliriz.

Ek kaynaklar

Python’da Spearman Sıra Korelasyonu Nasıl Hesaplanır?
Python’da kısmi korelasyon nasıl hesaplanır
Python’da Çapraz Korelasyon Nasıl Hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir