Comment réparer dans Pandas : impossible de convertir la chaîne en flottant



Une erreur courante que vous pouvez rencontrer lors de l’utilisation de pandas est :

ValueError: could not convert string to float: '$400.42'

Cette erreur se produit généralement lorsque vous tentez de convertir une chaîne en float dans pandas, alors que la chaîne contient un ou plusieurs des éléments suivants :

  • Les espaces
  • Virgules
  • Caractères spéciaux

Lorsque cela se produit, vous devez d’abord supprimer ces caractères de la chaîne avant de la convertir en flottant.

L’exemple suivant montre comment résoudre cette erreur dans la pratique.

Comment reproduire l’erreur

Supposons que nous ayons le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'store': ['A', 'B', 'C', 'D'],
                   'revenue': ['$400.42', '$100.18', '$243.75', '$194.22']})

#view DataFrame
print(df)

  store  revenue
0     A  $400.42
1     B  $100.18
2     C  $243.75
3     D  $194.22

#view data type of each column
print(df.dtypes)

store      object
revenue    object
dtype: object

Supposons maintenant que nous essayions de convertir la colonne revenue d’une chaîne en flottant :

#attempt to convert 'revenue' from string to float
df['revenue'] = df['revenue'].astype(float)

ValueError: could not convert string to float: '$400.42' 

Nous recevons une erreur car la colonne des revenus contient un signe dollar dans les chaînes.

Comment réparer l’erreur

La façon de résoudre cette erreur consiste à utiliser la fonction replace() pour remplacer les signes dollar dans la colonne des revenus par rien avant d’effectuer la conversion :

#convert revenue column to float
df['revenue'] = df['revenue'].apply(lambda x: float(x.split()[0].replace('$', '')))

#view updated DataFrame
print(df)

  store  revenue
0     A   400.42
1     B   100.18
2     C   243.75
3     D   194.22

#view data type of each column
print(df.dtypes)

store       object
revenue    float64
dtype: object

Notez que nous sommes en mesure de convertir la colonne de revenus d’une chaîne en flottant et que nous ne recevons aucune erreur puisque nous avons supprimé les signes dollar avant d’effectuer la conversion.

Ressources additionnelles

Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes en Python :

Comment réparer en Python : l’objet ‘numpy.ndarray’ n’est pas appelable
Comment réparer : TypeError : l’objet ‘numpy.float64’ n’est pas appelable
Comment réparer : erreur de type : chaîne attendue ou objet de type octets

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *