So berechnen sie den durchschnitt der spalten in pandas


Oftmals könnte es für Sie von Interesse sein, den Durchschnitt einer oder mehrerer Spalten in einem Pandas-DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas mit der Funktion Mean() problemlos tun.

Dieses Tutorial zeigt mehrere Beispiele für die Verwendung dieser Funktion.

Beispiel 1: Ermitteln Sie den Durchschnitt einer einzelnen Spalte

Angenommen, wir haben den folgenden Pandas-DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

        player points assists rebounds
0 A 25 5 NaN
1 B 20 7 8.0
2 C 14 7 10.0
3 D 16 8 6.0
4 E 27 5 6.0
5 F 20 7 9.0
6 G 12 6 6.0
7:15 9 10.0
8 I 14 9 10.0
9 D 19 5 7.0

Mit der folgenden Syntax können wir den Durchschnitt der Spalte mit der Bezeichnung „Punkte“ ermitteln:

 df['points']. mean ()

18.2

Die Funktion Mean() schließt NAs standardmäßig auch aus. Wenn wir beispielsweise den Durchschnitt der Spalte „Rebounds“ ermitteln, wird der erste Wert von „NaN“ einfach aus der Berechnung ausgeschlossen:

 df['rebounds']. mean ()

8.0

Wenn Sie versuchen, den Durchschnitt einer Spalte zu ermitteln, die nicht numerisch ist, erhalten Sie eine Fehlermeldung:

 df['player']. mean ()

TypeError: Could not convert ABCDEFGHIJ to numeric

Beispiel 2: Ermitteln Sie den Durchschnitt mehrerer Spalten

Mit der folgenden Syntax können wir den Durchschnitt mehrerer Spalten ermitteln:

 #find mean of points and rebounds columns
df[['rebounds', 'points']]. mean ()

rebounds 8.0
points 18.2
dtype:float64

Beispiel 3: Ermitteln Sie den Durchschnitt aller Spalten

Wir können den Durchschnitt aller numerischen Spalten auch mit der folgenden Syntax ermitteln:

 #find mean of all numeric columns in DataFrame
df. mean ()

points 18.2
assists 6.8
rebounds 8.0
dtype:float64

Beachten Sie, dass die Funktion „Mean()“ Spalten, die nicht numerisch sind, einfach ignoriert.

Zusätzliche Ressourcen

So berechnen Sie den Median bei Pandas
So berechnen Sie die Summe der Spalten in Pandas
So ermitteln Sie den Maximalwert von Spalten in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert