Pandalarda corrwith() nasıl kullanılır (örneklerle)


İki farklı panda DataFrames’te aynı ada sahip sayısal sütunlar arasındaki ikili korelasyonu hesaplamak için pandalarda corrwith() işlevini kullanabilirsiniz.

Bu işlev aşağıdaki temel sözdizimini kullanır:

 df1. corrwith (df2)

Not : Bu işlev, aynı DataFrame içindeki iki sayısal sütun arasındaki korelasyonu hesaplayan corr() işlevinden farklıdır.

Aşağıdaki örnek corrwith() fonksiyonunun pratikte nasıl kullanılacağını göstermektedir.

Örnek: Pandalarda corrwith() nasıl kullanılır?

Aşağıdaki iki panda DataFrame’e sahip olduğumuzu varsayalım:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [18, 22, 29, 25, 14, 11],
                    ' assists ': [4, 5, 5, 4, 8, 12],
                    ' rebounds ': [10, 6, 4, 6, 3, 5]})

print (df1)

  team points assists rebounds
0 to 18 4 10
1 B 22 5 6
2 C 29 5 4
3 D 25 4 6
4 E 14 8 3
5 F 11 12 5

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [22, 25, 27, 35, 25, 20],
                    ' assists ': [15, 13, 8, 8, 5, 8],
                    ' rebs ': [4, 11, 12, 8, 7, 10]})

print (df2)

  team points assists rebs
0 A 22 15 4
1 B 25 13 11
2 C 27 8 12
3 D 35 8 8
4 E 25 5 7
5 F 20 8 10

İki DataFrame’de aynı adlara sahip sayısal sütunlar arasındaki korelasyonu hesaplamak için corrwith() işlevini kullanabiliriz:

 #calculate correlation between numeric columns with same names in each DataFrame
df1. corrwith (df2)

points 0.677051
assists -0.478184
NaN rebounds
rebs NaN
dtype:float64

Sonuçtan şunları görebiliriz:

  • İki DataFrame’in nokta sütun değerleri arasındaki korelasyon 0,677’dir .
  • İki DataFrame’deki yardımcı sütun değerleri arasındaki korelasyon -0,478’dir .

Sütun adları sıçramalar ve geri dönüşler her iki DataFrame’de mevcut olmadığından, bu sütunların her biri için bir NaN değeri döndürülür.

Not #1 : Varsayılan olarak, corrwith() işlevi sütunlar arasındaki Pearson korelasyon katsayısını hesaplar, ancak korelasyon yerine farklı türde bir katsayı hesaplamak için method=’kendall’ veya method=’spearman’ da belirleyebilirsiniz.

Not #2 : Corrwith() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalar’da gruba göre korelasyon nasıl hesaplanır?
Pandalarda kayan korelasyon nasıl hesaplanır
Pandalar’da iki sütun arasındaki korelasyon nasıl hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir