Comment sélectionner des lignes avec des valeurs NaN dans Pandas (avec exemples)



Vous pouvez utiliser les méthodes suivantes pour sélectionner des lignes avec des valeurs NaN dans les pandas :

Méthode 1 : sélectionner des lignes avec des valeurs NaN dans n’importe quelle colonne

df.loc[df.isnull().any(axis=1)]

Méthode 2 : sélectionner les lignes avec des valeurs NaN dans une colonne spécifique

df.loc[df['this_column'].isnull()]

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd
import numpy as np

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   'points': [18, np.NaN, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, np.NaN, 9, 9, np.NaN],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, np.NaN]})

#view DataFrame
print(df)

Exemple 1 : sélectionner des lignes avec des valeurs NaN dans n’importe quelle colonne

Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes avec des valeurs NaN dans n’importe quelle colonne du DataFrame :

#create new DataFrame that only contains rows with NaNs in any column
df_nan_rows = df.loc[df.isnull().any(axis=1)]

#view results
print(df_nan_rows)

  team  points  assists  rebounds
1    B     NaN      7.0       8.0
4    E    14.0      NaN       6.0
7    H    28.0      NaN       NaN   

Notez que chaque ligne du DataFrame résultant contient une valeur NaN dans au moins une colonne.

Exemple 2 : sélectionner des lignes avec des valeurs NaN dans une colonne spécifique

Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes avec des valeurs NaN dans la colonne d’assistance du DataFrame :

#create new DataFrame that only contains rows with NaNs in assists column
df_assists_nans = df.loc[df['assists'].isnull()]
#view results
print(df_assists_nans)

  team  points  assists  rebounds
4    E    14.0      NaN       6.0
7    H    28.0      NaN       NaN   

Notez que chaque ligne du DataFrame résultant contient une valeur NaN dans la colonne d’assistance .

Il y a une ligne avec une valeur NaN dans la colonne des points , mais cette ligne n’est pas sélectionnée car elle n’a pas non plus de valeur NaN dans la colonne des passes décisives .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :

Pandas : Comment supprimer des lignes avec des valeurs NaN
Pandas : comment remplacer les valeurs NaN par une chaîne
Pandas : comment remplir les valeurs NaN avec la moyenne

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *