如何在 pandas 中运行 sumif 函数
您可以使用以下语法来查找 pandas DataFrame 中满足特定条件的行的总和:
#find sum of each column, grouped by one column
df. groupby (' group_column '). sum ()
#find sum of one specific column, grouped by one column
df. groupby (' group_column ')[' sum_column ']. sum ()
以下示例展示了如何将此语法与以下数据框结合使用:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['a', 'a', 'b', 'b', 'b', 'c', 'c'],
' points ': [5, 8, 14, 18, 5, 7, 7],
' assists ': [8, 8, 9, 3, 8, 7, 4],
' rebounds ': [1, 2, 2, 1, 0, 4, 1]})
#view DataFrame
df
team points assists rebounds
0 to 5 8 1
1 to 8 8 2
2 b 14 9 2
3 b 18 3 1
4 b 5 8 0
5 c 7 7 4
6 c 7 4 1
示例 1:对列运行 SUMIF 函数
以下代码显示了如何查找每个团队的得分总和:
df. groupby (' team ')[' points ']. sum ()
team
at 13
b 37
c 14
这告诉我们:
- A队共得13分
- b队总分37分
- c队共得14分
示例 2:对多列运行 SUMIF 函数
以下代码显示了如何查找每支球队的得分和篮板总数:
df. groupby (' team ')[[' points ', ' rebounds ']]. sum ()
rebound points
team
at 13 3
b 37 3
c 14 5
示例 3:对所有列运行 SUMIF 函数
以下代码显示了如何查找每个团队的数据框中所有列的总和:
df. groupby (' team '). sum ()
points assists rebounds
team
a 13 16 3
b 37 20 3
c 14 11 5