So berechnen sie den durchschnitt der spalten in pandas
Oftmals könnte es für Sie von Interesse sein, den Durchschnitt einer oder mehrerer Spalten in einem Pandas-DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas mit der Funktion Mean() problemlos tun.
Dieses Tutorial zeigt mehrere Beispiele für die Verwendung dieser Funktion.
Beispiel 1: Ermitteln Sie den Durchschnitt einer einzelnen Spalte
Angenommen, wir haben den folgenden Pandas-DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df player points assists rebounds 0 A 25 5 NaN 1 B 20 7 8.0 2 C 14 7 10.0 3 D 16 8 6.0 4 E 27 5 6.0 5 F 20 7 9.0 6 G 12 6 6.0 7:15 9 10.0 8 I 14 9 10.0 9 D 19 5 7.0
Mit der folgenden Syntax können wir den Durchschnitt der Spalte mit der Bezeichnung „Punkte“ ermitteln:
df['points']. mean ()
18.2
Die Funktion Mean() schließt NAs standardmäßig auch aus. Wenn wir beispielsweise den Durchschnitt der Spalte „Rebounds“ ermitteln, wird der erste Wert von „NaN“ einfach aus der Berechnung ausgeschlossen:
df['rebounds']. mean ()
8.0
Wenn Sie versuchen, den Durchschnitt einer Spalte zu ermitteln, die nicht numerisch ist, erhalten Sie eine Fehlermeldung:
df['player']. mean ()
TypeError: Could not convert ABCDEFGHIJ to numeric
Beispiel 2: Ermitteln Sie den Durchschnitt mehrerer Spalten
Mit der folgenden Syntax können wir den Durchschnitt mehrerer Spalten ermitteln:
#find mean of points and rebounds columns df[['rebounds', 'points']]. mean () rebounds 8.0 points 18.2 dtype:float64
Beispiel 3: Ermitteln Sie den Durchschnitt aller Spalten
Wir können den Durchschnitt aller numerischen Spalten auch mit der folgenden Syntax ermitteln:
#find mean of all numeric columns in DataFrame df. mean () points 18.2 assists 6.8 rebounds 8.0 dtype:float64
Beachten Sie, dass die Funktion „Mean()“ Spalten, die nicht numerisch sind, einfach ignoriert.
Zusätzliche Ressourcen
So berechnen Sie den Median bei Pandas
So berechnen Sie die Summe der Spalten in Pandas
So ermitteln Sie den Maximalwert von Spalten in Pandas