Pandas:如何更改数据透视表中的列名称


通常,您可能希望以特定方式更改 pandas 数据透视表中的列名称或设置其格式。

幸运的是,使用 pandas 的内置函数可以轻松做到这一点。

以下示例展示了如何执行此操作。

示例:更改 Pandas 数据透视表中的列名称

假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'G', 'C', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B G 9
5 B C 5
6 B F 5
7 B F 12

我们可以使用以下代码在 pandas 中创建一个数据透视表,显示 DataFrame 中每个团队位置的平均分值

 #create pivot table
piv = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')

#view pivot table
print (piv)

CFG position
team                   
A 8.0 6.0 4.0
B 5.0 8.5 9.0

现在,假设我们要删除数据透视表中单词的位置,并从数据透视表中删除额外的团队行。

我们可以使用以下语法来做到这一点:

 #format column names
iv. columns = ['_'. join (str(s). strip () for s in col if s) for col in piv. columns ]

#reset indexes
iv. reset_index (inplace= True )

#view updated pivot table
print (piv)

  team CFG
0 A 8.0 6.0 4.0
1 B 5.0 8.5 9.0

请注意,我们能够删除数据透视表中单词的位置,并从数据透视表中删除额外的团队行。

另请注意,此通用解决方案也适用于具有多重索引的数据透视表。

注意:您可以在此处找到 pandas hub_table()函数的完整文档。

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

Pandas:如何创建包含多个值的数据透视表
Pandas:如何用零替换数据透视表中的 NaN 值
Pandas:如何将数据透视表转换为 DataFrame

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注