Como contar valores ausentes em um dataframe do pandas
Freqüentemente, você pode querer contar o número de valores ausentes em um DataFrame do pandas.
Este tutorial mostra vários exemplos de como contar valores ausentes usando o seguinte DataFrame:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
Conte o total de valores ausentes em todo o DataFrame
O código a seguir mostra como calcular o número total de valores ausentes em todo o DataFrame:
df. isnull (). sum (). sum () 5
Isso nos diz que existem 5 valores ausentes no total.
Conte o total de valores ausentes por coluna
O código a seguir mostra como calcular o número total de valores ausentes em cada coluna do DataFrame:
df. isnull (). sum () at 2 b 2 c 1
Isso nos diz:
- A coluna “a” possui 2 valores ausentes.
- A coluna “b” possui 2 valores ausentes.
- A coluna “c” possui 1 valor ausente.
Você também pode exibir o número de valores ausentes como uma porcentagem de toda a coluna:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
Isso nos diz:
- Faltam 33,33% dos valores da coluna “a”.
- Faltam 33,33% dos valores da coluna “b”.
- Faltam 16,67% dos valores da coluna “c”.
Conte o total de valores ausentes por linha
O código a seguir mostra como calcular o número total de valores ausentes em cada linha do DataFrame:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
Isso nos diz:
- A linha 1 tem 1 valor ausente.
- A linha 2 tem 1 valor ausente.
- A linha 3 tem 1 valor ausente.
- A linha 4 tem 0 valores ausentes.
- A linha 5 tem 0 valores ausentes.
- A linha 6 tem 2 valores ausentes.
Recursos adicionais
Como encontrar valores únicos em múltiplas colunas no Pandas
Como criar uma nova coluna baseada em uma condição no Pandas