Rijen met nan-waarden selecteren in panda's (met voorbeelden)
U kunt de volgende methoden gebruiken om rijen met NaN-waarden in panda’s te selecteren:
Methode 1: Selecteer rijen met NaN-waarden in elke kolom
df. loc [df. isnull (). any (axis= 1 )]
Methode 2: Selecteer rijen met NaN-waarden in een specifieke kolom
df. loc [df[' this_column ']. isnull ()]
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, np.NaN, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, np.NaN, 9, 9, np.NaN], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.NaN]}) #view DataFrame print (df)
Voorbeeld 1: Selecteer rijen met NaN-waarden in een willekeurige kolom
We kunnen de volgende syntaxis gebruiken om rijen met NaN-waarden in elke kolom van het DataFrame te selecteren:
#create new DataFrame that only contains rows with NaNs in any column df_nan_rows = df. loc [df. isnull (). any (axis= 1 )] #view results print (df_nan_rows) team points assists rebounds 1 B NaN 7.0 8.0 4 E 14.0 NaN 6.0 7 H 28.0 NaN NaN
Houd er rekening mee dat elke rij van het resulterende DataFrame een NaN-waarde in ten minste één kolom bevat.
Voorbeeld 2: Selecteer rijen met NaN-waarden in een specifieke kolom
We kunnen de volgende syntaxis gebruiken om rijen met NaN-waarden in de helperkolom van het DataFrame te selecteren:
#create new DataFrame that only contains rows with NaNs in assists column df_assists_nans = df. loc [df[' assists ']. isnull ()] #view results print (df_assists_nans) team points assists rebounds 4 E 14.0 NaN 6.0 7 H 28.0 NaN NaN
Houd er rekening mee dat elke rij van het resulterende DataFrame een NaN-waarde in de helperkolom bevat.
Er is een rij met een NaN-waarde in de puntenkolom , maar deze rij is niet geselecteerd omdat deze ook geen NaN-waarde heeft in de assists- kolom.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Panda’s: rijen met NaN-waarden verwijderen
Panda’s: hoe NaN-waarden te vervangen door een string
Panda’s: hoe NaN-waarden met gemiddelde vullen