Panda's: maak een draaitabel met meerdere aggfunc


U kunt de volgende syntaxis gebruiken om een draaitabel in panda’s te maken en meerdere waarden aan het aggfunc- argument op te geven:

 df. pivot_table (index=' col1 ', values=' col2 ', aggfunc=(' sum ', ' mean '))

In dit specifieke voorbeeld wordt een draaitabel gemaakt die de som en het gemiddelde van de waarden in col2 weergeeft, gegroepeerd op col1 .

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Maak een Pandas-draaitabel met meerdere aggfunc

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

We kunnen de volgende code gebruiken om een draaitabel te maken die zowel de som als het gemiddelde aantal door elk team gescoorde punten samenvat:

 #create pivot table to summarize sum and mean of points by team
df. pivot_table (index=' team ', values=' points ', aggfunc=(' sum ', ' mean '))

	mean sum
team		
At 4.50 18
B 6.50 26
C 5.75 23

De resulterende draaitabel vat het gemiddelde en de som van de door elk team gescoorde punten samen.

We kunnen bijvoorbeeld zien:

  • Spelers van team A hadden een gemiddelde puntenwaarde van 4,50 en een totale puntenwaarde van 18 .
  • Spelers van team B hadden een gemiddelde puntenwaarde van 6,50 en een totale puntenwaarde van 26 .
  • Spelers van team C hadden een gemiddelde puntenwaarde van 5,75 en een totale puntenwaarde van 23 .

Houd er rekening mee dat we in dit voorbeeld de som en het gemiddelde hebben gebruikt, maar we kunnen ook aggregeren op basis van andere statistieken, zoals:

  • graaf
  • min
  • maximaal
  • mediaan
  • std (standaardafwijking)

Het volgende voorbeeld laat zien hoe u de puntenkolomwaarden kunt aggregeren op basis van deze statistieken voor elk team:

 #create pivot table to summarize several metrics for points by team
df. pivot_table (index=' team ', values=' points ',
               aggfunc=(' count ', ' min ', ' max ', ' median ', ' std '))

        count max median min std
team					
A 4 8 4.0 2 2.516611
B 4 9 6.0 5 1.914854
C 4 8 6.0 3 2.629956

Opmerking : u kunt hier de volledige documentatie van de pandas pivot_table() -functie vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende panda-taken kunt uitvoeren:

Panda’s: draaitabel sorteren op waarden in kolom
Panda’s: hoe u een draaitabel maakt met een som van waarden
Panda’s: subtotalen toevoegen aan de draaitabel
Panda’s: kolomnamen in een draaitabel wijzigen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert