Comment sélectionner des lignes sans valeurs NaN dans Pandas



Vous pouvez utiliser les méthodes suivantes pour sélectionner des lignes sans valeurs NaN dans les pandas :

Méthode 1 : sélectionner les lignes sans valeurs NaN dans toutes les colonnes

df[~df.isnull().any(axis=1)]

Méthode 2 : sélectionner les lignes sans valeurs NaN dans une colonne spécifique

df[~df['this_column'].isna()]

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd
import numpy as np

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G'],
                   'points': [np.nan, 12, 15, 25, np.nan, 22, 30],
                   'assists': [4, np.nan, 5, 9, 12, 14, 10]})

#view DataFrame
print(df)

  team  points  assists
0    A     NaN      4.0
1    B    12.0      NaN
2    C    15.0      5.0
3    D    25.0      9.0
4    E     NaN     12.0
5    F    22.0     14.0
6    G    30.0     10.0

Exemple 1 : sélectionner des lignes sans valeurs NaN dans toutes les colonnes

Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes sans valeurs NaN dans chaque colonne du DataFrame :

#create new DataFrame that only contains rows without NaNs
no_nans = df[~df.isnull().any(axis=1)]

#view results
print(no_nans)

  team  points  assists
2    C    15.0      5.0
3    D    25.0      9.0
5    F    22.0     14.0
6    G    30.0     10.0   

Notez que chaque ligne du DataFrame résultant ne contient aucune valeur NaN dans aucune colonne.

Exemple 2 : sélectionner des lignes sans valeurs NaN dans une colonne spécifique

Nous pouvons utiliser la syntaxe suivante pour sélectionner des lignes sans valeurs NaN dans la colonne points du DataFrame :

#create new DataFrame that only contains rows without NaNs in points column
no_points_nans = df[~df['points'].isna()]

#view results
print(no_points_nans)

  team  points  assists
1    B    12.0      NaN
2    C    15.0      5.0
3    D    25.0      9.0
5    F    22.0     14.0
6    G    30.0     10.0

Notez que chaque ligne du DataFrame résultant ne contient aucune valeur NaN dans la colonne des points .

Il y a une ligne avec une valeur NaN dans la colonne des assistances , mais la ligne est conservée dans le DataFrame puisque la valeur dans la colonne des points de cette ligne n’est pas NaN.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :

Pandas : Comment supprimer des lignes avec des valeurs NaN
Pandas : comment remplacer les valeurs NaN par une chaîne
Pandas : comment remplir les valeurs NaN avec la moyenne

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *