Hoe het gemiddelde van kolommen in panda's te berekenen
Vaak bent u wellicht geïnteresseerd in het berekenen van het gemiddelde van een of meer kolommen in een Panda DataFrame. Gelukkig kun je dit bij panda’s eenvoudig doen met behulp van de functie Mean() .
Deze tutorial toont verschillende voorbeelden van het gebruik van deze functie.
Voorbeeld 1: Vind het gemiddelde van een enkele kolom
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df player points assists rebounds 0 A 25 5 NaN 1 B 20 7 8.0 2 C 14 7 10.0 3 D 16 8 6.0 4 E 27 5 6.0 5 F 20 7 9.0 6 G 12 6 6.0 7:15 9 10.0 8 I 14 9 10.0 9 D 19 5 7.0
We kunnen het gemiddelde van de kolom met het label „punten“ vinden met behulp van de volgende syntaxis:
df['points']. mean ()
18.2
De functie Mean() sluit standaard ook NA’s uit. Als we bijvoorbeeld het gemiddelde van de kolom ‘rebounds’ vinden, wordt de eerste waarde van ‘NaN’ eenvoudigweg uitgesloten van de berekening:
df['rebounds']. mean ()
8.0
Als u het gemiddelde probeert te vinden van een kolom die niet numeriek is, krijgt u een foutmelding:
df['player']. mean ()
TypeError: Could not convert ABCDEFGHIJ to numeric
Voorbeeld 2: Vind het gemiddelde van meerdere kolommen
We kunnen het gemiddelde van meerdere kolommen vinden met behulp van de volgende syntaxis:
#find mean of points and rebounds columns df[['rebounds', 'points']]. mean () rebounds 8.0 points 18.2 dtype:float64
Voorbeeld 3: Vind het gemiddelde van alle kolommen
We kunnen ook het gemiddelde van alle numerieke kolommen vinden met behulp van de volgende syntaxis:
#find mean of all numeric columns in DataFrame df. mean () points 18.2 assists 6.8 rebounds 8.0 dtype:float64
Houd er rekening mee dat de functie Mean() eenvoudigweg kolommen negeert die niet numeriek zijn.
Aanvullende bronnen
Hoe de mediaan in panda’s te berekenen
Hoe de som van kolommen in Panda’s te berekenen
Hoe u de maximale waarde van kolommen in Panda’s kunt vinden