Hoe ontbrekende waarden in een pandas dataframe te tellen
Vaak wil je misschien het aantal ontbrekende waarden in een Panda DataFrame tellen.
Deze tutorial toont verschillende voorbeelden van hoe u ontbrekende waarden kunt tellen met behulp van het volgende DataFrame:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
Tel de totale ontbrekende waarden in het gehele DataFrame
De volgende code laat zien hoe u het totale aantal ontbrekende waarden in het gehele DataFrame berekent:
df. isnull (). sum (). sum () 5
Dit vertelt ons dat er in totaal 5 ontbrekende waarden zijn.
Tel de totale ontbrekende waarden per kolom
De volgende code laat zien hoe u het totale aantal ontbrekende waarden in elke kolom van het DataFrame berekent:
df. isnull (). sum () at 2 b 2 c 1
Dit vertelt ons:
- Kolom “a” bevat twee ontbrekende waarden.
- Kolom “b” bevat twee ontbrekende waarden.
- Kolom “c” bevat 1 ontbrekende waarde.
Je kunt het aantal ontbrekende waarden ook weergeven als percentage van de gehele kolom:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
Dit vertelt ons:
- 33,33% van de waarden in kolom “a” ontbreken.
- 33,33% van de waarden in kolom “b” ontbreken.
- 16,67% van de waarden in kolom “c” ontbreken.
Tel de totale ontbrekende waarden per rij
De volgende code laat zien hoe u het totale aantal ontbrekende waarden in elke rij van het DataFrame berekent:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
Dit vertelt ons:
- Regel 1 heeft 1 ontbrekende waarde.
- Regel 2 heeft 1 ontbrekende waarde.
- Regel 3 heeft 1 ontbrekende waarde.
- Regel 4 bevat 0 ontbrekende waarden.
- Regel 5 bevat 0 ontbrekende waarden.
- Regel 6 bevat twee ontbrekende waarden.
Aanvullende bronnen
Hoe unieke waarden in meerdere kolommen in Panda’s te vinden
Hoe u een nieuwe kolom maakt op basis van een voorwaarde in Pandas