Pandas : formule pour « Si la valeur dans la colonne alors »
Vous pouvez utiliser la syntaxe suivante dans pandas pour attribuer des valeurs à une colonne en fonction des valeurs d’une autre colonne :
df['new'] = df['col'].map(lambda x: 'new1' if 'A' in x else 'new2' if 'B' in x else '')
Cette syntaxe particulière créera une nouvelle colonne appelée « new » qui prendra les valeurs suivantes :
- new1 si la valeur dans col est égale à A.
- new2 si la valeur dans col est égale à B.
- Une chaîne vide si la valeur dans col est égale à toute autre valeur.
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : utilisation d’une formule pour « Si la valeur dans la colonne alors » dans Pandas
Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur divers joueurs de basket-ball :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C'], 'points': [14, 22, 25, 34, 30, 12, 10, 18]}) #view DataFrame print(df) team points 0 A 14 1 A 22 2 A 25 3 A 34 4 B 30 5 B 12 6 C 10 7 C 18
Supposons maintenant que nous souhaitions créer une nouvelle colonne appelée ville dont les valeurs dépendent de la valeur correspondante dans la colonne équipe .
Nous pouvons utiliser la syntaxe suivante pour ce faire :
#create new column called city whose values depend on values in team column
df['city'] = df['team'].map(lambda x: 'Atlanta' if 'A' in x else 'Boston' if 'B' in x else '')
#view updated DataFrame
print(df)
team points city
0 A 14 Atlanta
1 A 22 Atlanta
2 A 25 Atlanta
3 A 34 Atlanta
4 B 30 Boston
5 B 12 Boston
6 C 10
7 C 18
Cette syntaxe particulière a créé une nouvelle colonne appelée city qui prend les valeurs suivantes :
- Atlanta si la valeur en équipe est égale à A.
- Boston si la valeur en équipe est égale à B.
- Une chaîne vide si la valeur dans team est égale à toute autre valeur.
Notez que dans cet exemple, nous avons utilisé une chaîne vide après la dernière instruction else pour simplement laisser vides les valeurs qui ne remplissaient aucune condition.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Pandas : obtenir l’index des lignes dont la colonne correspond à la valeur
Pandas : comment sélectionner des colonnes contenant une chaîne spécifique
Pandas : comment vérifier si la colonne contient une chaîne