Pandalar: birden fazla sütuna dayalı bir sıklık tablosu oluşturun


Pandalarda birden fazla sütuna dayalı bir sıklık tablosu oluşturmak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df. value_counts ([' column1 ',' column2 '])

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Pandas’ta birden çok sütuna dayalı bir sıklık tablosu oluşturma

Takım adı, konumu ve çeşitli basketbol oyuncuları tarafından atılan puanlar hakkında bilgi içeren aşağıdaki panda DataFrame’e sahip olduğumuzu varsayalım:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'],
                   ' points ': [24, 33, 20, 15, 16, 16, 29, 25]})

#view DataFrame
print (df)

  team position points
0 AG 24
1 AG 33
2 AG 20
3 AF15
4 BG 16
5 BG 16
6 BF 29
7 BF 25

Takım ve konum sütunlarındaki her değer kombinasyonunun oluşumunu gösteren bir sıklık tablosu oluşturmak için value_counts() işlevini kullanabiliriz:

 #count frequency of values in team and position columns
df. value_counts ([' team ',' position '])

team position
GA 3
BF 2
      G2
AF1
dtype: int64

Sonuçlardan şunları görebiliriz:

  • A takımı ve G pozisyonu 3 kez ortaya çıkar
  • B takımı ve F pozisyonu 2 kez ortaya çıktı
  • B takımı ve G pozisyonu 2 kez ortaya çıktı
  • A takımı ve F pozisyonu 1 kez ortaya çıktı

Bunun yerine bir DataFrame döndürmek için reset_index() işlevini kullanabileceğimizi unutmayın:

 #count frequency of values in team and position columns and return DataFrame
df. value_counts ([' team ',' position ']). reset_index ()

        team position 0
0 A G 3
1 B F 2
2 B G 2
3 A F 1

Sayımları içeren sütunu yeniden adlandırmak için rename() işlevini kullanabiliriz:

 #get frequency of values in team and position column and rename count column
df. value_counts ([' team ',' position ']). reset_index (). rename (columns={0:' count '})

        team position count
0 A G 3
1 B F 2
2 B G 2
3 A F 1

Sonuçta Takım ve Pozisyon sütunlarındaki her benzersiz değer kombinasyonunun sıklığını içeren bir DataFrame elde edilir.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalar: GroupBy ve değer sayıları nasıl kullanılır?
Pandalar: GroupBy’yi çöp kutusu sayımı ile kullanma
Pandalar: Koşullu bir sütundaki değerler nasıl sayılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir