Panda's: groupby gebruiken en waardetellingen


U kunt de volgende basissyntaxis gebruiken om de frequentie van unieke waarden per groep in een Panda DataFrame te tellen:

 df. groupby ([' column1 ', ' column2 ']). size (). unstack (fill_value= 0 )

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: GroupBy en waardetellingen gebruiken in Panda’s

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' position ':['G', 'G', 'F', 'F', 'C', 'G', 'F', 'F', 'F', 'F'],
                   ' points ': [8, 8, 10, 10, 11, 8, 9, 10, 10, 10]})

#view DataFrame
print (df)

  team position points
0 AG 8
1 GA 8
2 AF10
3 AF 10
4 AC 11
5 BG 8
6 BF 9
7 BF 10
8 BF 10
9 BF 10

We kunnen de volgende syntaxis gebruiken om de frequentie van puntwaarden te tellen, gegroepeerd op team- en positiekolommen :

 #count frequency of points values, grouped by team and position
df. groupby ([' team ',' position ',' points ']). size (). unstack (fill_value= 0 )

	points 8 9 10 11
team position				
A C 0 0 0 1
        F 0 0 2 0
        G 2 0 0 0
B F 0 1 3 0
        G 1 0 0 0

Zo interpreteert u het resultaat:

  • De waarde 8 verscheen 0 keer in de puntenkolom voor spelers uit team A en positie C.
  • De waarde 9 verscheen 0 keer in de puntenkolom voor spelers uit team A en positie C.
  • De waarde 10 verscheen 0 keer in de puntenkolom voor spelers uit team A en positie C.
  • De waarde 11 verscheen 1 keer in de puntenkolom voor spelers uit team A en positie C.

Enzovoort.

We kunnen ook de volgende syntaxis gebruiken om de frequentie van posities te tellen, gegroepeerd per team :

 #count frequency of positions, grouped by team
df. groupby ([' team ', ' position ']). size (). unstack (fill_value= 0 )

position C F G
team			
A 1 2 2
B 0 4 1

Zo interpreteert u het resultaat:

  • De waarde ‚C‘ kwam 1 keer voor bij team A.
  • De waarde ‚F‘ verscheen 2 keer op team A.
  • De waarde ‚G‘ verscheen 2 keer op team A.
  • De waarde ‚C‘ kwam 0 keer voor bij team B.
  • De ‚F‘-waarde kwam 4 keer voor bij team B.
  • De waarde ‚G‘ kwam 1 keer voor bij team B.

Enzovoort.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe u een GroupBy-som uitvoert in Pandas
Hoe u unieke waarden kunt tellen met GroupBy in Pandas
Groupby en Plot gebruiken in Panda’s

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert