如何计算 pandas 中的列总和
通常,您可能对计算 pandas DataFrame 中一列或多列的总和感兴趣。幸运的是,您可以使用sum()函数在 pandas 中轻松完成此操作。
本教程展示了使用此功能的几个示例。
示例 1:求单列的总和
假设我们有以下 pandas DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df rating points assists rebounds 0 90 25 5 NaN 1 85 20 7 8 2 82 14 7 10 3 88 16 8 6 4 94 27 5 6 5 90 20 7 9 6 76 12 6 6 7 75 15 9 10 8 87 14 9 10 9 86 19 5 7
我们可以使用以下语法找到标记为“points”的列的总和:
df['points']. sum ()
182
sum() 函数默认也会排除 NA。例如,如果我们找到“篮板”列的总和,则第一个值“NaN”将被排除在计算之外:
df['rebounds']. sum ()
72.0
示例 2:求多列的总和
我们可以使用以下语法求多列的总和:
#find sum of points and rebounds columns df[['rebounds', 'points']]. sum () rebounds 72.0 points 182.0 dtype:float64
示例 3:求所有列的总和
我们还可以使用以下语法查找所有列的总和:
#find sum of all columns in DataFrame df. sum () rating 853.0 points 182.0 assists 68.0 rebounds 72.0 dtype:float64
对于非数字列,sum() 函数根本不会计算这些列的总和。
您可以在此处找到 sum() 函数的完整文档。