Come contare i valori mancanti in un pandas dataframe
Spesso potresti voler contare il numero di valori mancanti in un DataFrame panda.
Questo tutorial mostra diversi esempi su come contare i valori mancanti utilizzando il seguente DataFrame:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
Contare i valori mancanti totali nell’intero DataFrame
Il codice seguente mostra come calcolare il numero totale di valori mancanti nell’intero DataFrame:
df. isnull (). sum (). sum () 5
Questo ci dice che ci sono 5 valori mancanti in totale.
Contare i valori mancanti totali per colonna
Il codice seguente mostra come calcolare il numero totale di valori mancanti in ciascuna colonna del DataFrame:
df. isnull (). sum () at 2 b 2 c 1
Questo ci dice:
- La colonna “a” ha 2 valori mancanti.
- La colonna “b” ha 2 valori mancanti.
- La colonna “c” ha 1 valore mancante.
Puoi anche visualizzare il numero di valori mancanti come percentuale dell’intera colonna:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
Questo ci dice:
- Manca il 33,33% dei valori della colonna “a”.
- Manca il 33,33% dei valori della colonna “b”.
- Manca il 16,67% dei valori della colonna “c”.
Contare i valori mancanti totali per riga
Il codice seguente mostra come calcolare il numero totale di valori mancanti in ogni riga del DataFrame:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
Questo ci dice:
- La riga 1 ha 1 valore mancante.
- La riga 2 ha 1 valore mancante.
- La riga 3 ha 1 valore mancante.
- La riga 4 ha 0 valori mancanti.
- La riga 5 ha 0 valori mancanti.
- La riga 6 ha 2 valori mancanti.
Risorse addizionali
Come trovare valori univoci in più colonne in Pandas
Come creare una nuova colonna basata su una condizione in Pandas