Pandalar'da gruba göre korelasyon nasıl hesaplanır?


Pandalarda iki değişken arasındaki ilişkiyi gruba göre hesaplamak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df. groupby (' group_var ')[[' values1 ',' values2 ']]. corr (). unstack (). iloc [:, 1 ]

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Pandalar’da korelasyonu gruba göre hesaplama

Aşağıdaki pandalara sahip olduğumuzu varsayalım DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [2, 7, 9, 3, 12, 10, 14, 21]})

#view DataFrame
print (df)

Takımlara göre gruplandırılmış olarak puanlar ve asistler arasındaki korelasyonu hesaplamak için aşağıdaki kodu kullanabiliriz:

 #calculate correlation between points and assists, grouped by team
df. groupby (' team ')[[' points ',' assists ']]. corr (). unstack (). iloc [:, 1 ]

team
At 0.603053
B 0.981798
Name: (points, assists), dtype: float64

Sonuçtan şunları görebiliriz:

  • A Takımının puanları ve asistleri arasındaki korelasyon katsayısı 0,603053’tür .
  • B Takımının puanları ve asistleri arasındaki korelasyon katsayısı 0,981798’dir .

Her iki korelasyon katsayısı da pozitif olduğundan, bu bize her iki takım için de sayılar ve asistler arasındaki ilişkinin pozitif olduğunu gösteriyor.

Yani, daha fazla puan toplama eğiliminde olan oyuncular aynı zamanda daha fazla asist yapma eğiliminde oluyor.

İlgili: Ne “güçlü” bir korelasyon olarak kabul edilir?

unstack ve iloc işlevlerini kullanmayarak sözdizimini kısaltabileceğimizi, ancak sonuçların daha çirkin olduğunu unutmayın:

 df. groupby (' team ')[[' points ',' assists ']]. corr ()

		assist points
team			
A points 1.000000 0.603053
        assists 0.603053 1.000000
B points 1.000000 0.981798
        assists 0.981798 1.000000

Bu sözdizimi her iki takım için de bize fazladan bilgi sağlayan bir korelasyon matrisi üretir.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda GroupBy toplamı nasıl gerçekleştirilir?
Pandalarda Groupby ve Plot nasıl kullanılır?
Pandalar’da GroupBy kullanılarak benzersiz değerler nasıl sayılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir