Comment réparer dans Pandas : la valeur de vérité d’une série est ambiguë



Une erreur que vous pouvez rencontrer en Python est :

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(),
            a.any() or a.all().

Cette erreur se produit généralement lorsque vous tentez de filtrer un DataFrame pandas en utilisant les mots et et ou au lieu d’utiliser les caractères & et | les opérateurs.

Ce didacticiel explique comment résoudre cette erreur dans la pratique.

Comment reproduire l’erreur

Supposons que nous créions le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

  team  points  assists  rebounds
0    A      18        5        11
1    A      22        7         8
2    A      19        7        10
3    A      14        9         6
4    B      14       12         6
5    B      11        9         5
6    B      20        9         9
7    B      28        4        12

Supposons maintenant que nous essayions de filtrer les lignes où l’équipe est égale à « A » et les points sont inférieurs à 20 :

#attempt to filter DataFrame
df[(df['team'] == 'A') and (df['points'] < 20)]

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(),
            a.any() or a.all().

Ou supposons que nous essayions de filtrer les lignes où l’équipe est égale à « A » ou où les points sont inférieurs à 20 :

#attempt to filter DataFrame
df[(df['team'] == 'A') or (df['points'] < 20)]

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(),
            a.any() or a.all().

Dans les deux scénarios, nous recevons une erreur qui nous indique que la valeur de vérité d’une série est ambiguë.

Comment réparer l’erreur

Pour éviter cette erreur lors du filtrage, nous devons nous assurer que nous utilisons les éléments & et | les opérateurs.

Par exemple, nous pouvons utiliser le code suivant pour filtrer les lignes où l’équipe est égale à « A » et les points sont inférieurs à 20 :

#filter DataFrame
df[(df['team'] == 'A') & (df['points'] < 20)]

        team	points	assists	rebounds
0	A	18	5	11
2	A	19	7	10
3	A	14	9	6

Ou nous pourrions utiliser le code suivant pour filtrer les lignes où l’équipe est égale à « A » ou les points sont inférieurs à 20 :

#filter DataFrame
df[(df['team'] == 'A') | (df['points'] < 20)]

        team	points	assists	rebounds
0	A	18	5	11
1	A	22	7	8
2	A	19	7	10
3	A	14	9	6
4	B	14	12	6
5	B	11	9	5

Dans les deux scénarios, nous ne recevons pas d’erreur puisque nous avons utilisé les éléments & et | les opérateurs.

Remarque : Il est important d’inclure des parenthèses autour de chaque condition individuelle lors du filtrage d’un DataFrame pandas par plusieurs conditions, sinon vous recevrez une erreur.

Ressources additionnelles

Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes en Python :

Comment réparer : le module « pandas » n’a pas d’attribut « dataframe »
Comment réparer dans Pandas : SettingWithCopyWarning
Comment réparer dans Pandas : TypeError : aucune donnée numérique à tracer

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *