Panda's: bereken het gemiddelde en de standaard van een kolom in groupby
U kunt de volgende syntaxis gebruiken om het gemiddelde en de standaardafwijking van een kolom te berekenen na gebruik van de groupby()- bewerking in panda’s:
df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})
Dit specifieke voorbeeld groepeert de rijen van een panda’s DataFrame op de waarde in de kolom Team en berekent vervolgens het gemiddelde en de standaardafwijking van de waarden in de kolom Punten .
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Bereken het gemiddelde en de norm van een kolom in Panda’s groupby
Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over basketbalspelers van verschillende teams:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'], ' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28], ' assists ': [5, 5, 7, 9, 10, 14, 13, 8, 2, 7]}) #view DataFrame print (df) team points assists 0 to 12 5 1 to 15 5 2 To 17 7 3 To 17 9 4 B 19 10 5 B 14 14 6 B 15 13 7 C 20 8 8 C 24 2 9 C 28 7
We kunnen de volgende syntaxis gebruiken om het gemiddelde en de standaardafwijking van de waarden in de puntenkolom te berekenen, gegroepeerd op de teamkolom :
#calculate mean and standard deviation of points, grouped by team output = df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']}) #view results print (output) team points mean std 0 A 15.25 2.362908 1 B 16.00 2.645751 2 C 24.00 4.000000
Uit het resultaat kunnen we zien:
- De gemiddelde puntenwaarde van team A is 15,25 .
- De standaardafwijking van de punten van team A is 2,362908 .
Enzovoort.
We kunnen de kolommen ook hernoemen, zodat het resultaat gemakkelijker leesbaar is:
#rename columns output.output. columns = [' team ', ' points_mean ', ' points_std '] #view updated results print (output) team points_mean points_std 0 A 15.25 2.362908 1 B 16.00 2.645751 2 C 24.00 4.000000
Opmerking : u kunt de volledige documentatie van de pandas groupby()- bewerking hier vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe u een GroupBy-som uitvoert in Pandas
Groupby en Plot gebruiken in Panda’s
Hoe u unieke waarden kunt tellen met GroupBy in Pandas