Pandas: como preencher valores nan usando um dicionário
Você pode usar a função fillna() com um dicionário para substituir valores NaN em uma coluna de um DataFrame do pandas com base em valores em outra coluna.
Para fazer isso, você pode usar a seguinte sintaxe básica:
#define dictionary dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 } #replace values in col2 based on dictionary values in col1 df[' col2 '] = df[' col2 ']. fillna (df[' col1 ']. map (dict))
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Preencha valores NaN no Pandas usando um dicionário
Digamos que temos o seguinte DataFrame do pandas que contém informações sobre vendas feitas em várias lojas de varejo:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' store ': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'], ' sales ': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]}) #view DataFrame print (df) blind sales 0 to 12.0 1 A NaN 2 B 30.0 3 C NaN 4 D 24.0 5CNaN 6BNaN 7 D 13.0
Observe que existem vários valores NaN na coluna Vendas .
Digamos que queremos preencher esses NaNs na coluna de vendas usando valores que correspondem a valores específicos na coluna da loja .
Podemos usar a seguinte sintaxe para fazer isso:
#define dictionary dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 } #replace values in sales column based on dictionary values in store column df[' sales '] = df[' sales ']. fillna (df[' store ']. map (dict)) #view updated DataFrame print (df) blind sales 0 to 12.0 1 A 5.0 2 B 30.0 3C 15.0 4 D 24.0 5C 15.0 6 B 10.0 7 D 13.0
Utilizamos um dicionário para fazer as seguintes substituições na coluna de vendas:
- Se a loja for A , substitua NaN em Vendas pelo valor 5 .
- Se a loja for B , substitua NaN em vendas pelo valor 10 .
- Se store for C , substitua NaN em sales pelo valor 15 .
- Se a loja for D , substitua NaN em vendas pelo valor 20 .
Você pode encontrar a documentação online completa para a função fillna() aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como contar valores ausentes em pandas
Como deletar linhas com valores NaN no Pandas
Como deletar linhas contendo um valor específico no Pandas