Comment réparer : ValueError : impossible de convertir le float NaN en entier



Une erreur que vous pouvez rencontrer lors de l’utilisation de pandas est :

ValueError: cannot convert float NaN to integer

Cette erreur se produit lorsque vous tentez de convertir une colonne dans un DataFrame pandas d’un flottant en un entier, alors que la colonne contient des valeurs NaN.

L’exemple suivant montre comment corriger cette erreur dans la pratique.

Comment reproduire l’erreur

Supposons que nous créions le DataFrame pandas suivant :

import pandas as pd
import numpy as np

#create DataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, np.nan, 10, 6, 5, np.nan, 9, 12]})

#view DataFrame
df

        points	assists	 rebounds
0	25	5	 11
1	12	7	 NaN
2	15	7	 10
3	14	9	 6
4	19	12	 5
5	23	9	 NaN
6	25	9	 9
7	29	4	 12

Actuellement, la colonne « rebonds » est du type de données « float ».

#print data type of 'rebounds' column
df['rebounds'].dtype

dtype('float64')

Supposons que nous essayions de convertir la colonne « rebonds » d’un flottant en un entier :

#attempt to convert 'rebounds' column from float to integer
df['rebounds'] = df['rebounds'].astype(int)

ValueError: cannot convert float NaN to integer 

Nous recevons une ValueError car les valeurs NaN dans la colonne « rebonds » ne peuvent pas être converties en valeurs entières.

Comment réparer l’erreur

La façon de corriger cette erreur consiste à gérer les valeurs NaN avant d’essayer de convertir la colonne d’un flottant en un entier.

Nous pouvons utiliser le code suivant pour identifier d’abord les lignes qui contiennent des valeurs NaN :

#print rows in DataFrame that contain NaN in 'rebounds' column
print(df[df['rebounds'].isnull()])

   points  assists  rebounds
1      12        7       NaN
5      23        9       NaN

Nous pouvons ensuite soit supprimer les lignes avec des valeurs NaN, soit remplacer les valeurs NaN par une autre valeur avant de convertir la colonne d’un flottant en un entier :

Méthode 1 : supprimer les lignes avec des valeurs NaN

#drop all rows with NaN values
df = df.dropna()

#convert 'rebounds' column from float to integer
df['rebounds'] = df['rebounds'].astype(int) 

#view updated DataFrame
df
	points	assists	rebounds
0	25	5	11
2	15	7	10
3	14	9	6
4	19	12	5
6	25	9	9
7	29	4	12

#view class of 'rebounds' column
df['rebounds'].dtype

dtype('int64')

Méthode 2 : remplacer les valeurs NaN

#replace all NaN values with zeros
df['rebounds'] = df['rebounds'].fillna(0)

#convert 'rebounds' column from float to integer
df['rebounds'] = df['rebounds'].astype(int) 

#view updated DataFrame
df

	points	assists	rebounds
0	25	5	11
1	12	7	0
2	15	7	10
3	14	9	6
4	19	12	5
5	23	9	0
6	25	9	9
7	29	4	12

#view class of 'rebounds' column
df['rebounds'].dtype

dtype('int64')

Notez que les deux méthodes nous permettent d’éviter la ValueError et de convertir avec succès la colonne float en colonne entière.

Ressources additionnelles

Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes en Python :

Comment réparer : les colonnes se chevauchent mais aucun suffixe n’est spécifié
Comment réparer : l’objet ‘numpy.ndarray’ n’a pas d’attribut ‘append’
Comment réparer : si vous utilisez toutes les valeurs scalaires, vous devez transmettre un index

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *