Comment réparer dans Pandas : la valeur de vérité d’une série est ambiguë
Une erreur que vous pouvez rencontrer en Python est :
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(),
a.any() or a.all().
Cette erreur se produit généralement lorsque vous tentez de filtrer un DataFrame pandas en utilisant les mots et et ou au lieu d’utiliser les caractères & et | les opérateurs.
Ce didacticiel explique comment résoudre cette erreur dans la pratique.
Comment reproduire l’erreur
Supposons que nous créions le DataFrame pandas suivant :
import pandas as pd
#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
'points': [18, 22, 19, 14, 14, 11, 20, 28],
'assists': [5, 7, 7, 9, 12, 9, 9, 4],
'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print(df)
team points assists rebounds
0 A 18 5 11
1 A 22 7 8
2 A 19 7 10
3 A 14 9 6
4 B 14 12 6
5 B 11 9 5
6 B 20 9 9
7 B 28 4 12
Supposons maintenant que nous essayions de filtrer les lignes où l’équipe est égale à « A » et les points sont inférieurs à 20 :
#attempt to filter DataFrame
df[(df['team'] == 'A') and (df['points'] < 20)]
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(),
a.any() or a.all().
Ou supposons que nous essayions de filtrer les lignes où l’équipe est égale à « A » ou où les points sont inférieurs à 20 :
#attempt to filter DataFrame
df[(df['team'] == 'A') or (df['points'] < 20)]
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(),
a.any() or a.all().
Dans les deux scénarios, nous recevons une erreur qui nous indique que la valeur de vérité d’une série est ambiguë.
Comment réparer l’erreur
Pour éviter cette erreur lors du filtrage, nous devons nous assurer que nous utilisons les éléments & et | les opérateurs.
Par exemple, nous pouvons utiliser le code suivant pour filtrer les lignes où l’équipe est égale à « A » et les points sont inférieurs à 20 :
#filter DataFrame
df[(df['team'] == 'A') & (df['points'] < 20)]
team points assists rebounds
0 A 18 5 11
2 A 19 7 10
3 A 14 9 6
Ou nous pourrions utiliser le code suivant pour filtrer les lignes où l’équipe est égale à « A » ou les points sont inférieurs à 20 :
#filter DataFrame
df[(df['team'] == 'A') | (df['points'] < 20)]
team points assists rebounds
0 A 18 5 11
1 A 22 7 8
2 A 19 7 10
3 A 14 9 6
4 B 14 12 6
5 B 11 9 5
Dans les deux scénarios, nous ne recevons pas d’erreur puisque nous avons utilisé les éléments & et | les opérateurs.
Remarque : Il est important d’inclure des parenthèses autour de chaque condition individuelle lors du filtrage d’un DataFrame pandas par plusieurs conditions, sinon vous recevrez une erreur.
Ressources additionnelles
Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes en Python :
Comment réparer : le module « pandas » n’a pas d’attribut « dataframe »
Comment réparer dans Pandas : SettingWithCopyWarning
Comment réparer dans Pandas : TypeError : aucune donnée numérique à tracer