Comment rédiger une instruction de cas dans Pandas (avec exemple)



Une instruction case est un type d’instruction qui passe en revue des conditions et renvoie une valeur lorsque la première condition est remplie.

Le moyen le plus simple d’implémenter une instruction case dans un Pandas DataFrame consiste à utiliser la fonction NumPywhere() , qui utilise la syntaxe de base suivante :

df['new_column'] = np.where(df['col2']<9, 'value1',
                   np.where(df['col2']<12, 'value2',
                   np.where(df['col2']<15, 'value3', 'value4')))

Cette fonction particulière examine la valeur dans la colonne appelée col2 et renvoie :

  • « value1 » si la valeur dans col2 est inférieure à 9
  • « value2 » si la valeur dans col2 est inférieure à 12
  • « value3 » si la valeur dans col2 est inférieure à 15
  • « valeur4 » si aucune des conditions précédentes n’est vraie

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : instruction de cas dans Pandas

Supposons que nous ayons le DataFrame pandas suivant :

import pandas as pd
import numpy as np

#create DataFrame
df = pd.DataFrame({'player': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
                   'points': [6, 8, 9, 9, 12, 14, 15, 17, 19, 22]})

#view DataFrame
df

	player	points
0	1	6
1	2	8
2	3	9
3	4	9
4	5	12
5	6	14
6	7	15
7	8	17
8	9	19
9	10	22

Nous pouvons utiliser la syntaxe suivante pour écrire une instruction case qui crée une nouvelle colonne appelée classe dont les valeurs sont déterminées par les valeurs de la colonne points :

#add 'class' column using case-statement logic
df['class'] = np.where(df['points']<9, 'Bad',
              np.where(df['points']<12, 'OK',
              np.where(df['points']<15, 'Good', 'Great')))

#view updated DataFrame
df

	player	points	class
0	1	6	Bad
1	2	8	Bad
2	3	9	OK
3	4	9	OK
4	5	12	Good
5	6	14	Good
6	7	15	Great
7	8	17	Great
8	9	19	Great
9	10	22	Great

L’instruction case a examiné la valeur dans la colonne des points et a renvoyé :

  • « Mauvais » si la valeur dans la colonne des points était inférieure à 9
  • « OK » si la valeur dans la colonne des points était inférieure à 12
  • « Bon » si la valeur dans la colonne des points était inférieure à 15
  • « Génial » si aucune des conditions précédentes n’est vraie

Remarque : Vous pouvez trouver la documentation complète de la fonction NumPywhere() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans Pandas :

Comment créer une nouvelle colonne basée sur une condition dans Pandas
Comment utiliser la fonction NumPy Where() avec plusieurs conditions

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *