Pandas:如何向数据透视表添加过滤器


您可以使用以下基本语法向 pandas 数据透视表添加过滤条件:

 df[df. col1 == ' A ']. pivot_table (index=' col1 ', values=[' col2 ', ' col3 '], aggfunc=' sum ')

此特定示例创建一个数据透视表,显示col2col3值的总和,并按col1分组。

ivot_table()函数之前的过滤器指定我们只想包含原始 DataFrame 的col1中的值为“A”的行。

以下示例展示了如何在实践中使用此语法。

示例:如何向 Pandas 数据透视表添加过滤器

假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

我们可以使用以下代码在 pandas 中创建一个数据透视表,该数据透视表显示分数中的值的总和,并且仅针对原始 DataFrame 在分数列中具有值的行按团队分组的辅助等于“A”的团队

 #create pivot table for rows where team is equal to 'A'
df[df. team == ' A ']. pivot_table (index=' team ', values=[' points ', ' assists '],
                                 aggfunc=' sum ')

        assist points
team		
At 14 18

请注意,数据透视表仅汇总团队等于“A”的行的辅助列的值。

您还可以使用运算符&|应用使用“AND”或“OR”逻辑的过滤器。

例如,我们可以使用以下语法创建一个数据透视表,用于过滤原始 DataFrame 的team列中的值等于“A”或“B”的行:

 #create pivot table for rows where team is equal to 'A' or 'B'
df[( df.team == ' A ') | (df. team == ' B ')]. pivot_table (index=' team ',
                                                    values=[' points ', ' assists '],
                                                    aggfunc=' sum ')

	assist points
team		
At 14 18
B 19 26

请注意,数据透视表仅汇总团队等于“A”或“B”的行的辅助列中的值。

注意:您可以在此处找到 pandas hub_table()函数的完整文档。

其他资源

以下教程解释了如何在 pandas 中执行其他常见任务:

Pandas:如何按列中的值对数据透视表进行排序
Pandas:如何创建包含值总和的数据透视表
Pandas:如何将小计添加到数据透视表
Pandas:如何更改数据透视表中的列名称

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注