Pandas:如何用零替换数据透视表中的 nan 值
您可以使用 pandas 中的fill_value参数将数据透视表中的 NaN 值替换为零。
为此,您可以使用以下基本语法:
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )
以下示例展示了如何在实践中使用此语法。
示例:将数据透视表中的 NaN 值替换为零
假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B F 9 5 B F 5 6 B F 5 7 B F 12
我们可以使用以下代码在 pandas 中创建一个数据透视表,显示 DataFrame 中每个团队和位置的平均分值:
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')
#view pivot table
print (df_pivot)
CFG position
team
A 8.0 6.00 4.0
B NaN 7.75 NaN
请注意,数据透视表中有两个 NaN 值,因为在原始 DataFrame 中 B 队中没有球员有C或G位置,因此这两个位置在数据透视表中具有 NaN 值。
要在数据透视表中用零填充这些 NaN 值,我们可以使用fill_value参数:
#create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
fill_value= 0 )
#view pivot table
print (df_pivot)
CFG position
team
A 8 6.00 4
B 0 7.75 0
请注意,前面的数据透视表中的每个 NaN 值都已用零填充。
注意:您可以在此处找到 pandas hub_table()函数的完整文档。
其他资源
以下教程解释了如何在 pandas 中执行其他常见操作:
Pandas:如何将 DataFrame 从长到宽重塑
Pandas:如何将 DataFrame 从宽变为长
Pandas:如何跨多列进行分组和聚合