Hoe het gemiddelde van kolommen in panda's te berekenen


Vaak bent u wellicht geïnteresseerd in het berekenen van het gemiddelde van een of meer kolommen in een Panda DataFrame. Gelukkig kun je dit bij panda’s eenvoudig doen met behulp van de functie Mean() .

Deze tutorial toont verschillende voorbeelden van het gebruik van deze functie.

Voorbeeld 1: Vind het gemiddelde van een enkele kolom

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

        player points assists rebounds
0 A 25 5 NaN
1 B 20 7 8.0
2 C 14 7 10.0
3 D 16 8 6.0
4 E 27 5 6.0
5 F 20 7 9.0
6 G 12 6 6.0
7:15 9 10.0
8 I 14 9 10.0
9 D 19 5 7.0

We kunnen het gemiddelde van de kolom met het label „punten“ vinden met behulp van de volgende syntaxis:

 df['points']. mean ()

18.2

De functie Mean() sluit standaard ook NA’s uit. Als we bijvoorbeeld het gemiddelde van de kolom ‘rebounds’ vinden, wordt de eerste waarde van ‘NaN’ eenvoudigweg uitgesloten van de berekening:

 df['rebounds']. mean ()

8.0

Als u het gemiddelde probeert te vinden van een kolom die niet numeriek is, krijgt u een foutmelding:

 df['player']. mean ()

TypeError: Could not convert ABCDEFGHIJ to numeric

Voorbeeld 2: Vind het gemiddelde van meerdere kolommen

We kunnen het gemiddelde van meerdere kolommen vinden met behulp van de volgende syntaxis:

 #find mean of points and rebounds columns
df[['rebounds', 'points']]. mean ()

rebounds 8.0
points 18.2
dtype:float64

Voorbeeld 3: Vind het gemiddelde van alle kolommen

We kunnen ook het gemiddelde van alle numerieke kolommen vinden met behulp van de volgende syntaxis:

 #find mean of all numeric columns in DataFrame
df. mean ()

points 18.2
assists 6.8
rebounds 8.0
dtype:float64

Houd er rekening mee dat de functie Mean() eenvoudigweg kolommen negeert die niet numeriek zijn.

Aanvullende bronnen

Hoe de mediaan in panda’s te berekenen
Hoe de som van kolommen in Panda’s te berekenen
Hoe u de maximale waarde van kolommen in Panda’s kunt vinden

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert