Pandas:如何更改数据透视表中的列名称
通常,您可能希望以特定方式更改 pandas 数据透视表中的列名称或设置其格式。
幸运的是,使用 pandas 的内置函数可以轻松做到这一点。
以下示例展示了如何执行此操作。
示例:更改 Pandas 数据透视表中的列名称
假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'G', 'C', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B G 9 5 B C 5 6 B F 5 7 B F 12
我们可以使用以下代码在 pandas 中创建一个数据透视表,显示 DataFrame 中每个团队和位置的平均分值:
#create pivot table
piv = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')
#view pivot table
print (piv)
CFG position
team
A 8.0 6.0 4.0
B 5.0 8.5 9.0
现在,假设我们要删除数据透视表中单词的位置,并从数据透视表中删除额外的团队行。
我们可以使用以下语法来做到这一点:
#format column names
iv. columns = ['_'. join (str(s). strip () for s in col if s) for col in piv. columns ]
#reset indexes
iv. reset_index (inplace= True )
#view updated pivot table
print (piv)
team CFG
0 A 8.0 6.0 4.0
1 B 5.0 8.5 9.0
请注意,我们能够删除数据透视表中单词的位置,并从数据透视表中删除额外的团队行。
另请注意,此通用解决方案也适用于具有多重索引的数据透视表。
注意:您可以在此处找到 pandas hub_table()函数的完整文档。
其他资源
以下教程解释了如何在 pandas 中执行其他常见操作:
Pandas:如何创建包含多个值的数据透视表
Pandas:如何用零替换数据透视表中的 NaN 值
Pandas:如何将数据透视表转换为 DataFrame