Panda's: bereken het gemiddelde en de standaard van een kolom in groupby


U kunt de volgende syntaxis gebruiken om het gemiddelde en de standaardafwijking van een kolom te berekenen na gebruik van de groupby()- bewerking in panda’s:

 df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

Dit specifieke voorbeeld groepeert de rijen van een panda’s DataFrame op de waarde in de kolom Team en berekent vervolgens het gemiddelde en de standaardafwijking van de waarden in de kolom Punten .

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Bereken het gemiddelde en de norm van een kolom in Panda’s groupby

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over basketbalspelers van verschillende teams:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28],
                   ' assists ': [5, 5, 7, 9, 10, 14, 13, 8, 2, 7]})
                            
#view DataFrame
print (df)

  team points assists
0 to 12 5
1 to 15 5
2 To 17 7
3 To 17 9
4 B 19 10
5 B 14 14
6 B 15 13
7 C 20 8
8 C 24 2
9 C 28 7

We kunnen de volgende syntaxis gebruiken om het gemiddelde en de standaardafwijking van de waarden in de puntenkolom te berekenen, gegroepeerd op de teamkolom :

 #calculate mean and standard deviation of points, grouped by team
output = df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

#view results
print (output)

  team points          
         mean std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Uit het resultaat kunnen we zien:

  • De gemiddelde puntenwaarde van team A is 15,25 .
  • De standaardafwijking van de punten van team A is 2,362908 .

Enzovoort.

We kunnen de kolommen ook hernoemen, zodat het resultaat gemakkelijker leesbaar is:

 #rename columns
output.output. columns = [' team ', ' points_mean ', ' points_std ']

#view updated results
print (output)

  team points_mean points_std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Opmerking : u kunt de volledige documentatie van de pandas groupby()- bewerking hier vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe u een GroupBy-som uitvoert in Pandas
Groupby en Plot gebruiken in Panda’s
Hoe u unieke waarden kunt tellen met GroupBy in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert