Panda's: bereken het gemiddelde en de standaard van een kolom in groupby

Von Dr.benjamin anderson Juli 12, 2023 Gids Keine Kommentare

U kunt de volgende syntaxis gebruiken om het gemiddelde en de standaardafwijking van een kolom te berekenen na gebruik van de groupby()- bewerking in panda’s:

 df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

Dit specifieke voorbeeld groepeert de rijen van een panda’s DataFrame op de waarde in de kolom Team en berekent vervolgens het gemiddelde en de standaardafwijking van de waarden in de kolom Punten .

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Bereken het gemiddelde en de norm van een kolom in Panda’s groupby

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over basketbalspelers van verschillende teams:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28],
                   ' assists ': [5, 5, 7, 9, 10, 14, 13, 8, 2, 7]})
                            
#view DataFrame
print (df)

  team points assists
0 to 12 5
1 to 15 5
2 To 17 7
3 To 17 9
4 B 19 10
5 B 14 14
6 B 15 13
7 C 20 8
8 C 24 2
9 C 28 7

We kunnen de volgende syntaxis gebruiken om het gemiddelde en de standaardafwijking van de waarden in de puntenkolom te berekenen, gegroepeerd op de teamkolom :

 #calculate mean and standard deviation of points, grouped by team
output = df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

#view results
print (output)

  team points          
         mean std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Uit het resultaat kunnen we zien:

De gemiddelde puntenwaarde van team A is 15,25 .
De standaardafwijking van de punten van team A is 2,362908 .

Enzovoort.

We kunnen de kolommen ook hernoemen, zodat het resultaat gemakkelijker leesbaar is:

 #rename columns
output.output. columns = [' team ', ' points_mean ', ' points_std ']

#view updated results
print (output)

  team points_mean points_std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Opmerking : u kunt de volledige documentatie van de pandas groupby()- bewerking hier vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe u een GroupBy-som uitvoert in Pandas
Groupby en Plot gebruiken in Panda’s
Hoe u unieke waarden kunt tellen met GroupBy in Pandas

Über den Autor

Dr.benjamin anderson

Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder

Voorbeeld: Bereken het gemiddelde en de norm van een kolom in Panda’s groupby

Aanvullende bronnen

Über den Autor

Dr.benjamin anderson

Einen Kommentar hinzufügen