Pandas:创建具有多个 aggfunc 的数据透视表


您可以使用以下语法在 pandas 中创建数据透视表并为aggfunc参数提供多个值:

 df. pivot_table (index=' col1 ', values=' col2 ', aggfunc=(' sum ', ' mean '))

此特定示例创建一个数据透视表,显示col2中按col1分组的值的总和和平均值。

以下示例展示了如何在实践中使用此语法。

示例:创建具有多个 aggfunc 的 Pandas 数据透视表

假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

我们可以使用以下代码创建一个数据透视表,汇总每支球队的总得分和平均得分

 #create pivot table to summarize sum and mean of points by team
df. pivot_table (index=' team ', values=' points ', aggfunc=(' sum ', ' mean '))

	mean sum
team		
At 4.50 18
B 6.50 26
C 5.75 23

生成的数据透视表总结了每支球队得分的平均值和总和。

例如,我们可以看到:

  • A队队员平均得分为4.50 ,总得分为18
  • B队选手平均分6.5分,总分26分
  • C队选手平均分5.75分,总分23分

请注意,在本例中我们使用总和和平均值进行聚合,但我们也可以通过其他指标进行聚合,例如:

  • 数数
  • 分钟
  • 最大限度
  • 中位数
  • std(标准差)

以下示例展示了如何根据每个团队的这些指标聚合分数列值:

 #create pivot table to summarize several metrics for points by team
df. pivot_table (index=' team ', values=' points ',
               aggfunc=(' count ', ' min ', ' max ', ' median ', ' std '))

        count max median min std
team					
A 4 8 4.0 2 2.516611
B 4 9 6.0 5 1.914854
C 4 8 6.0 3 2.629956

注意:您可以在此处找到 pandas hub_table()函数的完整文档。

其他资源

以下教程解释了如何执行其他常见的 panda 任务:

Pandas:如何按列中的值对数据透视表进行排序
Pandas:如何创建包含值总和的数据透视表
Pandas:如何将小计添加到数据透视表
Pandas:如何更改数据透视表中的列名称

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注