Como contar valores ausentes em um dataframe do pandas


Freqüentemente, você pode querer contar o número de valores ausentes em um DataFrame do pandas.

Este tutorial mostra vários exemplos de como contar valores ausentes usando o seguinte DataFrame:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

Conte o total de valores ausentes em todo o DataFrame

O código a seguir mostra como calcular o número total de valores ausentes em todo o DataFrame:

 df. isnull (). sum (). sum ()

5

Isso nos diz que existem 5 valores ausentes no total.

Conte o total de valores ausentes por coluna

O código a seguir mostra como calcular o número total de valores ausentes em cada coluna do DataFrame:

 df. isnull (). sum ()

at 2
b 2
c 1

Isso nos diz:

  • A coluna “a” possui 2 valores ausentes.
  • A coluna “b” possui 2 valores ausentes.
  • A coluna “c” possui 1 valor ausente.

Você também pode exibir o número de valores ausentes como uma porcentagem de toda a coluna:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

Isso nos diz:

  • Faltam 33,33% dos valores da coluna “a”.
  • Faltam 33,33% dos valores da coluna “b”.
  • Faltam 16,67% dos valores da coluna “c”.

Conte o total de valores ausentes por linha

O código a seguir mostra como calcular o número total de valores ausentes em cada linha do DataFrame:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

Isso nos diz:

  • A linha 1 tem 1 valor ausente.
  • A linha 2 tem 1 valor ausente.
  • A linha 3 tem 1 valor ausente.
  • A linha 4 tem 0 valores ausentes.
  • A linha 5 tem 0 valores ausentes.
  • A linha 6 tem 2 valores ausentes.

Recursos adicionais

Como encontrar valores únicos em múltiplas colunas no Pandas
Como criar uma nova coluna baseada em uma condição no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *