Pandalarda grup görülmeleri nasıl sayılır?
Çoğu zaman bir pandanın DataFrame’inde grup başına gözlem sayısını saymak ilginizi çekebilir.
Neyse ki, groupby() ve size() işlevlerini aşağıdaki sözdizimiyle kullanarak bunu yapmak kolaydır:
df. groupby (' column_name '). size ()
Bu eğitimde, aşağıdaki veri çerçevesini kullanarak bu işlevin pratik kullanımına ilişkin birkaç örnek açıklanmaktadır:
import numpy as np import pandas as pd #create pandas DataFrame df = pd. DataFrame ({'team': ['A', 'A', 'B', 'B', 'B', 'C', 'C'], 'division':['E', 'W', 'E', 'E', 'W', 'W', 'E'], 'rebounds': [11, 8, 7, 6, 6, 5, 12]}) #display DataFrame print (df) team division rebounds 0 AE 11 1 AW 8 2 BE 7 3 BE 6 4 BW 6 5 CW 5 6 CE 12
Örnek 1: bir değişkene göre sayma
Aşağıdaki kod, takım başına toplam gözlem sayısının nasıl sayılacağını gösterir:
#count total observations by variable 'team' df. groupby (' team '). size () team At 2 B 3 C 2 dtype: int64
Sonuçtan şunu görebiliriz:
- A takımının 2 gözlemi var
- B Takımının 3 gözlemi var
- C Takımının 2 gözlemi var
Önceki kodun bir seri ürettiğini unutmayın. Çoğu durumda bir DataFrame ile çalışmak isteriz, dolayısıyla bunun yerine bir DataFrame oluşturmak için reset_index() işlevini kullanabiliriz:
df. groupby (' team '). size (). reset_index (name=' obs ') team obs 0 to 2 1 B 3 2 C 2
Örnek 2: bir değişkene göre sayma ve sıralama
Grup sayısını sıralamak için sort_values() fonksiyonunu da kullanabiliriz.
Grup sayısını en büyükten en küçüğe sıralamak için artan=Yanlış veya küçükten büyüğe sıralamak için artan=True belirtebiliriz:
df. groupby (' team '). size (). reset_index (name=' obs '). sort_values ([' obs '], ascending= True ) team obs 0 to 2 2 C 2 1 B 3
Örnek 3: Birkaç değişkene göre sayma
Ayrıca bir pandanın DataFrame’inde çeşitli değişkenlere göre gruplandırılmış gözlemlerin sayısını da sayabiliriz:
#count observations grouped by team and division df. groupby ([' team ',' division ']). size (). reset_index (name=' obs ') team division obs 0 A E 1 1 A W 1 2 B E 2 3 B W 1 4 C E 1 5 C W 1
Sonuçtan şunu görebiliriz:
- 1 gözlem A takımına ve E grubuna aittir
- 1 gözlem A takımına ve W grubuna aittir
- 2 gözlem B takımına ve E bölümüne aittir
- 1 gözlem B takımına ve W grubuna aittir
- 1 gözlem C takımına ve E grubuna aittir
- 1 gözlem C takımına ve W grubuna aittir
Ek kaynaklar
Pandalar’da sütunların toplamı nasıl hesaplanır?
Pandalar’daki sütunların ortalaması nasıl hesaplanır?
Pandalarda sütunların maksimum değeri nasıl bulunur?