So zählen sie fehlende werte in einem pandas dataframe
Oft möchten Sie möglicherweise die Anzahl der fehlenden Werte in einem Pandas-DataFrame zählen.
Dieses Tutorial zeigt mehrere Beispiele zum Zählen fehlender Werte mithilfe des folgenden DataFrame:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
Zählen Sie die gesamten fehlenden Werte im gesamten DataFrame
Der folgende Code zeigt, wie die Gesamtzahl der fehlenden Werte im gesamten DataFrame berechnet wird:
df. isnull (). sum (). sum () 5
Dies sagt uns, dass insgesamt 5 Werte fehlen.
Zählen Sie die gesamten fehlenden Werte pro Spalte
Der folgende Code zeigt, wie die Gesamtzahl der fehlenden Werte in jeder Spalte des DataFrame berechnet wird:
df. isnull (). sum () at 2 b 2 c 1
Das sagt uns:
- In Spalte „a“ fehlen zwei Werte.
- In Spalte „b“ fehlen zwei Werte.
- In Spalte „c“ fehlt 1 Wert.
Sie können sich auch die Anzahl der fehlenden Werte als Prozentsatz der gesamten Spalte anzeigen lassen:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
Das sagt uns:
- 33,33 % der Werte in Spalte „a“ fehlen.
- 33,33 % der Werte in Spalte „b“ fehlen.
- 16,67 % der Werte in Spalte „c“ fehlen.
Zählen Sie die gesamten fehlenden Werte pro Zeile
Der folgende Code zeigt, wie die Gesamtzahl der fehlenden Werte in jeder Zeile des DataFrame berechnet wird:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
Das sagt uns:
- In Zeile 1 fehlt 1 Wert.
- In Zeile 2 fehlt 1 Wert.
- In Zeile 3 fehlt 1 Wert.
- In Zeile 4 fehlen 0 Werte.
- In Zeile 5 fehlen 0 Werte.
- In Zeile 6 fehlen zwei Werte.
Zusätzliche Ressourcen
So finden Sie in Pandas eindeutige Werte in mehreren Spalten
So erstellen Sie eine neue Spalte basierend auf einer Bedingung in Pandas