Pandas:如何用零替换数据透视表中的 nan 值


您可以使用 pandas 中的fill_value参数将数据透视表中的 NaN 值替换为零。

为此,您可以使用以下基本语法:

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )

以下示例展示了如何在实践中使用此语法。

示例:将数据透视表中的 NaN 值替换为零

假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B F 9
5 B F 5
6 B F 5
7 B F 12

我们可以使用以下代码在 pandas 中创建一个数据透视表,显示 DataFrame 中每个团队位置的平均分值

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')

#view pivot table
print (df_pivot)

CFG position
team                    
A 8.0 6.00 4.0
B NaN 7.75 NaN

请注意,数据透视表中有两个 NaN 值,因为在原始 DataFrame 中 B 队中没有球员有CG位置,因此这两个位置在数据透视表中具有 NaN 值。

要在数据透视表中用零填充这些 NaN 值,我们可以使用fill_value参数:

 #create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          fill_value= 0 )

#view pivot table
print (df_pivot)

CFG position
team                
A 8 6.00 4
B 0 7.75 0

请注意,前面的数据透视表中的每个 NaN 值都已用零填充。

注意:您可以在此处找到 pandas hub_table()函数的完整文档。

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

Pandas:如何将 DataFrame 从长到宽重塑
Pandas:如何将 DataFrame 从宽变为长
Pandas:如何跨多列进行分组和聚合

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注