So berechnen sie die summe der spalten in pandas
Oftmals könnte es für Sie von Interesse sein, die Summe einer oder mehrerer Spalten in einem Pandas-DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas einfach mit der Funktion sum() tun.
Dieses Tutorial zeigt mehrere Beispiele für die Verwendung dieser Funktion.
Beispiel 1: Ermitteln Sie die Summe einer einzelnen Spalte
Angenommen, wir haben den folgenden Pandas-DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df rating points assists rebounds 0 90 25 5 NaN 1 85 20 7 8 2 82 14 7 10 3 88 16 8 6 4 94 27 5 6 5 90 20 7 9 6 76 12 6 6 7 75 15 9 10 8 87 14 9 10 9 86 19 5 7
Mit der folgenden Syntax können wir die Summe der Spalte mit der Bezeichnung „Punkte“ ermitteln:
df['points']. sum ()
182
Die Funktion sum() schließt standardmäßig auch NAs aus. Wenn wir beispielsweise die Summe der Spalte „Rebounds“ ermitteln, wird der erste Wert von „NaN“ einfach aus der Berechnung ausgeschlossen:
df['rebounds']. sum ()
72.0
Beispiel 2: Ermitteln Sie die Summe mehrerer Spalten
Mit der folgenden Syntax können wir die Summe mehrerer Spalten ermitteln:
#find sum of points and rebounds columns df[['rebounds', 'points']]. sum () rebounds 72.0 points 182.0 dtype:float64
Beispiel 3: Ermitteln Sie die Summe aller Spalten
Wir können die Summe aller Spalten auch mit der folgenden Syntax ermitteln:
#find sum of all columns in DataFrame df. sum () rating 853.0 points 182.0 assists 68.0 rebounds 72.0 dtype:float64
Bei Spalten, die nicht numerisch sind, berechnet die Funktion sum() einfach nicht die Summe dieser Spalten.
Die vollständige Dokumentation der sum()-Funktion finden Sie hier .