Come contare i valori mancanti in un pandas dataframe


Spesso potresti voler contare il numero di valori mancanti in un DataFrame panda.

Questo tutorial mostra diversi esempi su come contare i valori mancanti utilizzando il seguente DataFrame:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

Contare i valori mancanti totali nell’intero DataFrame

Il codice seguente mostra come calcolare il numero totale di valori mancanti nell’intero DataFrame:

 df. isnull (). sum (). sum ()

5

Questo ci dice che ci sono 5 valori mancanti in totale.

Contare i valori mancanti totali per colonna

Il codice seguente mostra come calcolare il numero totale di valori mancanti in ciascuna colonna del DataFrame:

 df. isnull (). sum ()

at 2
b 2
c 1

Questo ci dice:

  • La colonna “a” ha 2 valori mancanti.
  • La colonna “b” ha 2 valori mancanti.
  • La colonna “c” ha 1 valore mancante.

Puoi anche visualizzare il numero di valori mancanti come percentuale dell’intera colonna:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

Questo ci dice:

  • Manca il 33,33% dei valori della colonna “a”.
  • Manca il 33,33% dei valori della colonna “b”.
  • Manca il 16,67% dei valori della colonna “c”.

Contare i valori mancanti totali per riga

Il codice seguente mostra come calcolare il numero totale di valori mancanti in ogni riga del DataFrame:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

Questo ci dice:

  • La riga 1 ha 1 valore mancante.
  • La riga 2 ha 1 valore mancante.
  • La riga 3 ha 1 valore mancante.
  • La riga 4 ha 0 valori mancanti.
  • La riga 5 ha 0 valori mancanti.
  • La riga 6 ha 2 valori mancanti.

Risorse addizionali

Come trovare valori univoci in più colonne in Pandas
Come creare una nuova colonna basata su una condizione in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *