Comment sélectionner des lignes avec des valeurs NaN dans Pandas (avec exemples)
Vous pouvez utiliser les méthodes suivantes pour sélectionner des lignes avec des valeurs NaN dans les pandas :
Méthode 1 : sélectionner des lignes avec des valeurs NaN dans n’importe quelle colonne
df.loc[df.isnull().any(axis=1)]
Méthode 2 : sélectionner les lignes avec des valeurs NaN dans une colonne spécifique
df.loc[df['this_column'].isnull()]
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :
import pandas as pd import numpy as np #create DataFrame df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], 'points': [18, np.NaN, 19, 14, 14, 11, 20, 28], 'assists': [5, 7, 7, 9, np.NaN, 9, 9, np.NaN], 'rebounds': [11, 8, 10, 6, 6, 5, 9, np.NaN]}) #view DataFrame print(df)
Exemple 1 : sélectionner des lignes avec des valeurs NaN dans n’importe quelle colonne
Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes avec des valeurs NaN dans n’importe quelle colonne du DataFrame :
#create new DataFrame that only contains rows with NaNs in any column df_nan_rows = df.loc[df.isnull().any(axis=1)] #view results print(df_nan_rows) team points assists rebounds 1 B NaN 7.0 8.0 4 E 14.0 NaN 6.0 7 H 28.0 NaN NaN
Notez que chaque ligne du DataFrame résultant contient une valeur NaN dans au moins une colonne.
Exemple 2 : sélectionner des lignes avec des valeurs NaN dans une colonne spécifique
Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes avec des valeurs NaN dans la colonne d’assistance du DataFrame :
#create new DataFrame that only contains rows with NaNs in assists column df_assists_nans = df.loc[df['assists'].isnull()] #view results print(df_assists_nans) team points assists rebounds 4 E 14.0 NaN 6.0 7 H 28.0 NaN NaN
Notez que chaque ligne du DataFrame résultant contient une valeur NaN dans la colonne d’assistance .
Il y a une ligne avec une valeur NaN dans la colonne des points , mais cette ligne n’est pas sélectionnée car elle n’a pas non plus de valeur NaN dans la colonne des passes décisives .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Pandas : Comment supprimer des lignes avec des valeurs NaN
Pandas : comment remplacer les valeurs NaN par une chaîne
Pandas : comment remplir les valeurs NaN avec la moyenne