Pandas: como preencher valores nan usando um dicionário


Você pode usar a função fillna() com um dicionário para substituir valores NaN em uma coluna de um DataFrame do pandas com base em valores em outra coluna.

Para fazer isso, você pode usar a seguinte sintaxe básica:

 #define dictionary
dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 }

#replace values in col2 based on dictionary values in col1
df[' col2 '] = df[' col2 ']. fillna (df[' col1 ']. map (dict))

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Preencha valores NaN no Pandas usando um dicionário

Digamos que temos o seguinte DataFrame do pandas que contém informações sobre vendas feitas em várias lojas de varejo:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'],
                   ' sales ': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]})

#view DataFrame
print (df)

  blind sales
0 to 12.0
1 A NaN
2 B 30.0
3 C NaN
4 D 24.0
5CNaN
6BNaN
7 D 13.0

Observe que existem vários valores NaN na coluna Vendas .

Digamos que queremos preencher esses NaNs na coluna de vendas usando valores que correspondem a valores específicos na coluna da loja .

Podemos usar a seguinte sintaxe para fazer isso:

 #define dictionary
dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 }

#replace values in sales column based on dictionary values in store column
df[' sales '] = df[' sales ']. fillna (df[' store ']. map (dict))

#view updated DataFrame
print (df)

  blind sales
0 to 12.0
1 A 5.0
2 B 30.0
3C 15.0
4 D 24.0
5C 15.0
6 B 10.0
7 D 13.0

Utilizamos um dicionário para fazer as seguintes substituições na coluna de vendas:

  • Se a loja for A , substitua NaN em Vendas pelo valor 5 .
  • Se a loja for B , substitua NaN em vendas pelo valor 10 .
  • Se store for C , substitua NaN em sales pelo valor 15 .
  • Se a loja for D , substitua NaN em vendas pelo valor 20 .

Você pode encontrar a documentação online completa para a função fillna() aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como contar valores ausentes em pandas
Como deletar linhas com valores NaN no Pandas
Como deletar linhas contendo um valor específico no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *