Pandas:如何创建包含值总和的数据透视表


您可以使用以下基本语法在 pandas 中创建数据透视表,显示某些列中的值的总和:

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' sum ')

以下示例展示了如何在实践中使用此语法。

示例:创建包含值总和的 Pandas 数据透视表

假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)


  team position points
0 AG 4
1 GA 4
2 AF 6
3AF 8
4 BG 9
5 BF 5
6 BF 5
7 BF 12

下面的代码展示了如何在pandas中创建一个数据透视表,显示DataFrame中每个“团队”和“位置”的“点”值的总和:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' sum ')

#view pivot table
print (df_pivot)

FG position
team           
At 14 8
B 22 9

从结果我们可以看出:

  • A队F位球员总共得到14分。
  • A队G位选手共得8分。
  • B队F位球员合计得到22分。
  • B队G位球员合计得到9分。

请注意,我们还可以使用margins参数在数据透视表中显示边距总和:

 #create pivot table with margins
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' sum ', margins= True , margins_name=' Sum ')

#view pivot table
print (df_pivot)

position FG Sum
team                 
A 14 8 22
B 22 9 31
Total 36 17 53

数据透视表现在显示行和列的总和。

注意:您可以在此处找到 pandas hub_table()函数的完整文档。

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

Pandas:如何将 DataFrame 从长到宽重塑
Pandas:如何将 DataFrame 从宽变为长
Pandas:如何跨多列进行分组和聚合

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注