Pandalarda grup görülmeleri nasıl sayılır?


Çoğu zaman bir pandanın DataFrame’inde grup başına gözlem sayısını saymak ilginizi çekebilir.

Neyse ki, groupby() ve size() işlevlerini aşağıdaki sözdizimiyle kullanarak bunu yapmak kolaydır:

 df. groupby (' column_name '). size ()

Bu eğitimde, aşağıdaki veri çerçevesini kullanarak bu işlevin pratik kullanımına ilişkin birkaç örnek açıklanmaktadır:

 import numpy as np
import pandas as pd

#create pandas DataFrame
df = pd. DataFrame ({'team': ['A', 'A', 'B', 'B', 'B', 'C', 'C'],
                   'division':['E', 'W', 'E', 'E', 'W', 'W', 'E'],
                   'rebounds': [11, 8, 7, 6, 6, 5, 12]})

#display DataFrame
print (df)

  team division rebounds
0 AE 11
1 AW 8
2 BE 7
3 BE 6
4 BW 6
5 CW 5
6 CE 12

Örnek 1: bir değişkene göre sayma

Aşağıdaki kod, takım başına toplam gözlem sayısının nasıl sayılacağını gösterir:

 #count total observations by variable 'team'
df. groupby (' team '). size ()

team
At 2
B 3
C 2
dtype: int64

Sonuçtan şunu görebiliriz:

  • A takımının 2 gözlemi var
  • B Takımının 3 gözlemi var
  • C Takımının 2 gözlemi var

Önceki kodun bir seri ürettiğini unutmayın. Çoğu durumda bir DataFrame ile çalışmak isteriz, dolayısıyla bunun yerine bir DataFrame oluşturmak için reset_index() işlevini kullanabiliriz:

 df. groupby (' team '). size (). reset_index (name=' obs ')

        team obs
0 to 2
1 B 3
2 C 2

Örnek 2: bir değişkene göre sayma ve sıralama

Grup sayısını sıralamak için sort_values() fonksiyonunu da kullanabiliriz.

Grup sayısını en büyükten en küçüğe sıralamak için artan=Yanlış veya küçükten büyüğe sıralamak için artan=True belirtebiliriz:

 df. groupby (' team '). size (). reset_index (name=' obs '). sort_values ([' obs '], ascending= True )

        team obs
0 to 2
2 C 2
1 B 3

Örnek 3: Birkaç değişkene göre sayma

Ayrıca bir pandanın DataFrame’inde çeşitli değişkenlere göre gruplandırılmış gözlemlerin sayısını da sayabiliriz:

 #count observations grouped by team and division
df. groupby ([' team ',' division ']). size (). reset_index (name=' obs ')

        team division obs
0 A E 1
1 A W 1
2 B E 2
3 B W 1
4 C E 1
5 C W 1

Sonuçtan şunu görebiliriz:

  • 1 gözlem A takımına ve E grubuna aittir
  • 1 gözlem A takımına ve W grubuna aittir
  • 2 gözlem B takımına ve E bölümüne aittir
  • 1 gözlem B takımına ve W grubuna aittir
  • 1 gözlem C takımına ve E grubuna aittir
  • 1 gözlem C takımına ve W grubuna aittir

Ek kaynaklar

Pandalar’da sütunların toplamı nasıl hesaplanır?
Pandalar’daki sütunların ortalaması nasıl hesaplanır?
Pandalarda sütunların maksimum değeri nasıl bulunur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir