Comment réparer : impossible d’exécuter « rand_ » avec un tableau dtypé [int64] et un scalaire de type [bool]



Une erreur que vous pouvez rencontrer en Python est la suivante :

TypeError:Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool]

Cette erreur se produit généralement lorsque vous tentez de filtrer un DataFrame pandas en utilisant plusieurs conditions mais que vous ne parvenez pas à utiliser des parenthèses autour de chaque condition individuelle.

L’exemple suivant montre comment corriger cette erreur dans la pratique.

Comment reproduire l’erreur

Supposons que nous ayons le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

  team  points  assists  rebounds
0    A      18        5        11
1    A      22        7         8
2    A      19        7        10
3    A      14        9         6
4    B      14       12         6
5    B      11        9         5
6    B      20        9         9
7    B      28        4        12

Supposons maintenant que nous essayions de filtrer le DataFrame pour afficher uniquement les lignes où la colonne d’équipe est égale à « A » et la colonne de points est supérieure à 15 :

#attempt to filter DataFrame
df.loc[df.team == 'A' & df.points > 15]

TypeError:Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool]

Nous recevons une erreur car nous n’avons pas placé de parenthèses autour de chaque condition individuelle.

Comment réparer l’erreur

Pour corriger cette erreur, nous devons simplement nous assurer de placer des parenthèses autour de chaque condition individuelle lors de l’exécution du filtre :

#filter DataFrame
df.loc[(df.team == 'A') & (df.points > 15)]

	team	points	assists	rebounds
0	A	18	5	11
1	A	22	7	8
2	A	19	7	10

Notez que nous sommes en mesure de filtrer avec succès le DataFrame pour afficher uniquement les lignes où l’équipe est égale à « A » et où les points sont supérieurs à 15.

Notez que nous devons également placer des parenthèses autour de chaque condition individuelle si nous utilisons un ou « | » opérateur à la place :

#filter rows where team is equal to 'A' or points is greater than 15
df.loc[(df.team == 'A') | (df.points > 15)]

team	points	assists	rebounds
0	A	18	5	11
1	A	22	7	8
2	A	19	7	10
3	A	14	9	6
6	B	20	9	9
7	B	28	4	12

Notez que nous évitons encore une fois toute erreur.

Ressources additionnelles

Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes dans les pandas :

Comment réparer : le module « pandas » n’a pas d’attribut « dataframe »
Comment réparer : TypeError : aucune donnée numérique à tracer
Comment réparer KeyError dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *