Comment rédiger une instruction de cas dans Pandas (avec exemple)
Une instruction case est un type d’instruction qui passe en revue des conditions et renvoie une valeur lorsque la première condition est remplie.
Le moyen le plus simple d’implémenter une instruction case dans un Pandas DataFrame consiste à utiliser la fonction NumPywhere() , qui utilise la syntaxe de base suivante :
df['new_column'] = np.where(df['col2']<9, 'value1', np.where(df['col2']<12, 'value2', np.where(df['col2']<15, 'value3', 'value4')))
Cette fonction particulière examine la valeur dans la colonne appelée col2 et renvoie :
- « value1 » si la valeur dans col2 est inférieure à 9
- « value2 » si la valeur dans col2 est inférieure à 12
- « value3 » si la valeur dans col2 est inférieure à 15
- « valeur4 » si aucune des conditions précédentes n’est vraie
L’exemple suivant montre comment utiliser cette fonction dans la pratique.
Exemple : instruction de cas dans Pandas
Supposons que nous ayons le DataFrame pandas suivant :
import pandas as pd import numpy as np #create DataFrame df = pd.DataFrame({'player': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'points': [6, 8, 9, 9, 12, 14, 15, 17, 19, 22]}) #view DataFrame df player points 0 1 6 1 2 8 2 3 9 3 4 9 4 5 12 5 6 14 6 7 15 7 8 17 8 9 19 9 10 22
Nous pouvons utiliser la syntaxe suivante pour écrire une instruction case qui crée une nouvelle colonne appelée classe dont les valeurs sont déterminées par les valeurs de la colonne points :
#add 'class' column using case-statement logic df['class'] = np.where(df['points']<9, 'Bad', np.where(df['points']<12, 'OK', np.where(df['points']<15, 'Good', 'Great'))) #view updated DataFrame df player points class 0 1 6 Bad 1 2 8 Bad 2 3 9 OK 3 4 9 OK 4 5 12 Good 5 6 14 Good 6 7 15 Great 7 8 17 Great 8 9 19 Great 9 10 22 Great
L’instruction case a examiné la valeur dans la colonne des points et a renvoyé :
- « Mauvais » si la valeur dans la colonne des points était inférieure à 9
- « OK » si la valeur dans la colonne des points était inférieure à 12
- « Bon » si la valeur dans la colonne des points était inférieure à 15
- « Génial » si aucune des conditions précédentes n’est vraie
Remarque : Vous pouvez trouver la documentation complète de la fonction NumPywhere() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans Pandas :
Comment créer une nouvelle colonne basée sur une condition dans Pandas
Comment utiliser la fonction NumPy Where() avec plusieurs conditions