Pandas:如何使用字典填充 nan 值
您可以将fillna()函数与字典结合使用,根据另一列中的值替换 pandas DataFrame 的一列中的 NaN 值。
为此,您可以使用以下基本语法:
#define dictionary dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 } #replace values in col2 based on dictionary values in col1 df[' col2 '] = df[' col2 ']. fillna (df[' col1 ']. map (dict))
以下示例展示了如何在实践中使用此语法。
示例:使用字典在 Pandas 中填充 NaN 值
假设我们有以下 pandas DataFrame,其中包含有关各个零售商店的销售信息:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' store ': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'], ' sales ': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]}) #view DataFrame print (df) blind sales 0 to 12.0 1 A NaN 2 B 30.0 3 C NaN 4 D 24.0 5CNaN 6BNaN 7 D 13.0
请注意, Sales列中有多个 NaN 值。
假设我们想要使用与store列中的特定值相对应的值来填充sales列中的这些 NaN。
我们可以使用以下语法来做到这一点:
#define dictionary dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 } #replace values in sales column based on dictionary values in store column df[' sales '] = df[' sales ']. fillna (df[' store ']. map (dict)) #view updated DataFrame print (df) blind sales 0 to 12.0 1 A 5.0 2 B 30.0 3C 15.0 4 D 24.0 5C 15.0 6 B 10.0 7 D 13.0
我们使用字典在 sales 列中进行以下替换:
- 如果商店是A ,请将 Sales 中的 NaN 替换为值5 。
- 如果商店是B ,请将 sales 中的 NaN 替换为值10 。
- 如果 store 是C ,请将 sales 中的 NaN 替换为值15 。
- 如果商店是D ,请将 sales 中的 NaN 替换为值20 。
您可以在此处找到fillna()函数的完整在线文档。
其他资源
以下教程解释了如何在 pandas 中执行其他常见操作: