Comment sélectionner des lignes sans valeurs NaN dans Pandas
Vous pouvez utiliser les méthodes suivantes pour sélectionner des lignes sans valeurs NaN dans les pandas :
Méthode 1 : sélectionner les lignes sans valeurs NaN dans toutes les colonnes
df[~df.isnull().any(axis=1)]
Méthode 2 : sélectionner les lignes sans valeurs NaN dans une colonne spécifique
df[~df['this_column'].isna()]
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :
import pandas as pd import numpy as np #create DataFrame df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G'], 'points': [np.nan, 12, 15, 25, np.nan, 22, 30], 'assists': [4, np.nan, 5, 9, 12, 14, 10]}) #view DataFrame print(df) team points assists 0 A NaN 4.0 1 B 12.0 NaN 2 C 15.0 5.0 3 D 25.0 9.0 4 E NaN 12.0 5 F 22.0 14.0 6 G 30.0 10.0
Exemple 1 : sélectionner des lignes sans valeurs NaN dans toutes les colonnes
Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes sans valeurs NaN dans chaque colonne du DataFrame :
#create new DataFrame that only contains rows without NaNs no_nans = df[~df.isnull().any(axis=1)] #view results print(no_nans) team points assists 2 C 15.0 5.0 3 D 25.0 9.0 5 F 22.0 14.0 6 G 30.0 10.0
Notez que chaque ligne du DataFrame résultant ne contient aucune valeur NaN dans aucune colonne.
Exemple 2 : sélectionner des lignes sans valeurs NaN dans une colonne spécifique
Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes sans valeurs NaN dans la colonne points du DataFrame :
#create new DataFrame that only contains rows without NaNs in points column no_points_nans = df[~df['points'].isna()] #view results print(no_points_nans) team points assists 1 B 12.0 NaN 2 C 15.0 5.0 3 D 25.0 9.0 5 F 22.0 14.0 6 G 30.0 10.0
Notez que chaque ligne du DataFrame résultant ne contient aucune valeur NaN dans la colonne des points .
Il y a une ligne avec une valeur NaN dans la colonne des assistances , mais la ligne est conservée dans le DataFrame puisque la valeur dans la colonne des points de cette ligne n’est pas NaN.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Pandas : Comment supprimer des lignes avec des valeurs NaN
Pandas : comment remplacer les valeurs NaN par une chaîne
Pandas : comment remplir les valeurs NaN avec la moyenne