Pandalar: groupby()'nin size() ile nasıl kullanılacağı


Grup başına oluşum sayısını saymak için pandalarda groupby() ve size() işlevleriyle aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: bir değişkene göre gruplandırılmış oluşumları sayın

 df. groupby (' var1 '). size ()

Yöntem 2: Birden çok değişkene göre gruplandırılmış oluşumları sayın

 df. groupby ([' var1 ', ' var2 ']). size ()

Yöntem 3: Birden çok değişkene göre gruplandırılmış ve sayıya göre sıralanmış oluşumları sayın

 df. groupby ([' var1 ', ' var2 ']). size (). sort_values (ascending= False )

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'F', 'F', 'G', 'G', 'G', 'G', 'F'],
                   ' points ': [15, 22, 24, 25, 20, 35, 34, 19, 14, 12]})

#view DataFrame
print (df)

  team position points
0 AG 15
1 AG 22
2 AF 24
3 AF 25
4 AF 20
5 BG 35
6 BG 34
7 BG 19
8 BG 14
9 BF 12

Örnek 1: bir değişkene göre gruplandırılmış oluşumları sayın

Aşağıdaki kod, takım sütunundaki değerlerin oluşumlarını saymak için groupby() ve size() işlevlerinin nasıl kullanılacağını gösterir:

 #count occurrences of each value in team column
df. groupby (' team '). size ()

team
AT 5
B5
dtype: int64

Sonuçtan A ve B değerlerinin her ikisinin de takım sütununda 5’er kez göründüğünü görebiliriz.

Örnek 2: Birden fazla değişkene göre gruplandırılmış oluşumları sayın

Aşağıdaki kod, takım ve konum sütunlarındaki her değer birleşimi için değerlerin oluşumlarını saymak amacıyla groupby() ve size() işlevlerinin nasıl kullanılacağını gösterir:

 #count occurrences of values for each combination of team and position
df. groupby ([' team ', ' position ']). size ()

team position
AF3
      G2
BF 1
      G4
dtype: int64

Sonuçtan şunları görebiliriz:

  • A takımı ve F pozisyonu 3 kez görünür.
  • A takımı ve G konumu iki kez görünür.

Ve benzeri.

Örnek 3: çeşitli değişkenlere göre gruplandırılmış olayları sayın ve sıralayın

Aşağıdaki kod, takım ve konum sütunlarındaki her değer birleşimi için değerlerin oluşumlarını saymak ve ardından sayıya göre sıralamak için groupby() ve size() işlevlerinin nasıl kullanılacağını gösterir:

 #count occurrences for each combination of team and position and sort
df. groupby ([' team ', ' position ']). size (). sort_values (ascending= False )

team position
BG 4
AF3
      G2
BF 1
dtype: int64

Çıktı, takım ve pozisyon değerlerinin her bir kombinasyonunun sayısını, sayıya göre azalan düzende sıralanmış olarak görüntüler.

Not : Artan düzende sayıya göre sıralamak için sort_values() işlevinde artan=False öğesini kaldırmanız yeterlidir.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandas GroupBy kullanılarak benzersiz değerler nasıl sayılır?
Pandas Groupby’ye bir işlev nasıl uygulanır?
Pandas GroupBy’den Bar Grafiği Nasıl Oluşturulur

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir