Comment réparer : ValueError : impossible de convertir le float NaN en entier
Une erreur que vous pouvez rencontrer lors de l’utilisation de pandas est :
ValueError: cannot convert float NaN to integer
Cette erreur se produit lorsque vous tentez de convertir une colonne dans un DataFrame pandas d’un flottant en un entier, alors que la colonne contient des valeurs NaN.
L’exemple suivant montre comment corriger cette erreur dans la pratique.
Comment reproduire l’erreur
Supposons que nous créions le DataFrame pandas suivant :
import pandas as pd import numpy as np #create DataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, np.nan, 10, 6, 5, np.nan, 9, 12]}) #view DataFrame df points assists rebounds 0 25 5 11 1 12 7 NaN 2 15 7 10 3 14 9 6 4 19 12 5 5 23 9 NaN 6 25 9 9 7 29 4 12
Actuellement, la colonne « rebonds » est du type de données « float ».
#print data type of 'rebounds' column df['rebounds'].dtype dtype('float64')
Supposons que nous essayions de convertir la colonne « rebonds » d’un flottant en un entier :
#attempt to convert 'rebounds' column from float to integer df['rebounds'] = df['rebounds'].astype(int) ValueError: cannot convert float NaN to integer
Nous recevons une ValueError car les valeurs NaN dans la colonne « rebonds » ne peuvent pas être converties en valeurs entières.
Comment réparer l’erreur
La façon de corriger cette erreur consiste à gérer les valeurs NaN avant d’essayer de convertir la colonne d’un flottant en un entier.
Nous pouvons utiliser le code suivant pour identifier d’abord les lignes qui contiennent des valeurs NaN :
#print rows in DataFrame that contain NaN in 'rebounds' column print(df[df['rebounds'].isnull()]) points assists rebounds 1 12 7 NaN 5 23 9 NaN
Nous pouvons ensuite soit supprimer les lignes avec des valeurs NaN, soit remplacer les valeurs NaN par une autre valeur avant de convertir la colonne d’un flottant en un entier :
Méthode 1 : supprimer les lignes avec des valeurs NaN
#drop all rows with NaN values df = df.dropna() #convert 'rebounds' column from float to integer df['rebounds'] = df['rebounds'].astype(int) #view updated DataFrame df points assists rebounds 0 25 5 11 2 15 7 10 3 14 9 6 4 19 12 5 6 25 9 9 7 29 4 12 #view class of 'rebounds' column df['rebounds'].dtype dtype('int64')
Méthode 2 : remplacer les valeurs NaN
#replace all NaN values with zeros df['rebounds'] = df['rebounds'].fillna(0) #convert 'rebounds' column from float to integer df['rebounds'] = df['rebounds'].astype(int) #view updated DataFrame df points assists rebounds 0 25 5 11 1 12 7 0 2 15 7 10 3 14 9 6 4 19 12 5 5 23 9 0 6 25 9 9 7 29 4 12 #view class of 'rebounds' column df['rebounds'].dtype dtype('int64')
Notez que les deux méthodes nous permettent d’éviter la ValueError et de convertir avec succès la colonne float en colonne entière.
Ressources additionnelles
Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes en Python :
Comment réparer : les colonnes se chevauchent mais aucun suffixe n’est spécifié
Comment réparer : l’objet ‘numpy.ndarray’ n’a pas d’attribut ‘append’
Comment réparer : si vous utilisez toutes les valeurs scalaires, vous devez transmettre un index