Pandalar: groupby()'nin size() ile nasıl kullanılacağı
Grup başına oluşum sayısını saymak için pandalarda groupby() ve size() işlevleriyle aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: bir değişkene göre gruplandırılmış oluşumları sayın
df. groupby (' var1 '). size ()
Yöntem 2: Birden çok değişkene göre gruplandırılmış oluşumları sayın
df. groupby ([' var1 ', ' var2 ']). size ()
Yöntem 3: Birden çok değişkene göre gruplandırılmış ve sayıya göre sıralanmış oluşumları sayın
df. groupby ([' var1 ', ' var2 ']). size (). sort_values (ascending= False )
Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'F', 'F', 'G', 'G', 'G', 'G', 'F'], ' points ': [15, 22, 24, 25, 20, 35, 34, 19, 14, 12]}) #view DataFrame print (df) team position points 0 AG 15 1 AG 22 2 AF 24 3 AF 25 4 AF 20 5 BG 35 6 BG 34 7 BG 19 8 BG 14 9 BF 12
Örnek 1: bir değişkene göre gruplandırılmış oluşumları sayın
Aşağıdaki kod, takım sütunundaki değerlerin oluşumlarını saymak için groupby() ve size() işlevlerinin nasıl kullanılacağını gösterir:
#count occurrences of each value in team column
df. groupby (' team '). size ()
team
AT 5
B5
dtype: int64
Sonuçtan A ve B değerlerinin her ikisinin de takım sütununda 5’er kez göründüğünü görebiliriz.
Örnek 2: Birden fazla değişkene göre gruplandırılmış oluşumları sayın
Aşağıdaki kod, takım ve konum sütunlarındaki her değer birleşimi için değerlerin oluşumlarını saymak amacıyla groupby() ve size() işlevlerinin nasıl kullanılacağını gösterir:
#count occurrences of values for each combination of team and position
df. groupby ([' team ', ' position ']). size ()
team position
AF3
G2
BF 1
G4
dtype: int64
Sonuçtan şunları görebiliriz:
- A takımı ve F pozisyonu 3 kez görünür.
- A takımı ve G konumu iki kez görünür.
Ve benzeri.
Örnek 3: çeşitli değişkenlere göre gruplandırılmış olayları sayın ve sıralayın
Aşağıdaki kod, takım ve konum sütunlarındaki her değer birleşimi için değerlerin oluşumlarını saymak ve ardından sayıya göre sıralamak için groupby() ve size() işlevlerinin nasıl kullanılacağını gösterir:
#count occurrences for each combination of team and position and sort
df. groupby ([' team ', ' position ']). size (). sort_values (ascending= False )
team position
BG 4
AF3
G2
BF 1
dtype: int64
Çıktı, takım ve pozisyon değerlerinin her bir kombinasyonunun sayısını, sayıya göre azalan düzende sıralanmış olarak görüntüler.
Not : Artan düzende sayıya göre sıralamak için sort_values() işlevinde artan=False öğesini kaldırmanız yeterlidir.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandas GroupBy kullanılarak benzersiz değerler nasıl sayılır?
Pandas Groupby’ye bir işlev nasıl uygulanır?
Pandas GroupBy’den Bar Grafiği Nasıl Oluşturulur