Comment réparer : ValueError : impossible de définir une ligne avec des colonnes qui ne correspondent pas
Une erreur que vous pouvez rencontrer lors de l’utilisation de pandas est :
ValueError: cannot set a row with mismatched columns
Cette erreur se produit lorsque vous tentez d’ajouter une nouvelle ligne à un DataFrame pandas mais que le nombre de valeurs dans la nouvelle ligne ne correspond pas au nombre de colonnes dans le DataFrame existant.
L’exemple suivant montre comment corriger cette erreur dans la pratique.
Comment reproduire l’erreur
Supposons que nous créions le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'], 'points': [18, 22, 19, 14, 14, 11, 20, 28, 22], 'assists': [5, 7, 7, 9, 12, 9, 9, 4, 8], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12, 9]}) #view DataFrame df team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7 H 28 4 12 8 I 22 8 9
Supposons maintenant que nous essayions d’ajouter une nouvelle ligne à la fin du DataFrame :
#define new row to append
new_team = ['J', 30]
#append row to DataFrame
df.loc[len(df)] = new_team
#view updated DataFrame
df
ValueError: cannot set a row with mismatched columns
Nous recevons une ValueError car la nouvelle ligne que nous essayons d’ajouter ne contient que deux valeurs, mais le DataFrame existant comporte quatre colonnes.
Comment réparer l’erreur
Le moyen le plus simple de corriger cette erreur est d’utiliser la fonction append() pour ajouter la nouvelle ligne à la fin du DataFrame, qui remplira automatiquement les valeurs manquantes avec NaN :
La syntaxe suivante montre comment utiliser cette fonction en pratique :
#define new row to append new = ['J', 30] #append row to end of DataFrame df = df.append(pd.Series(new, index=df.columns[:len(new)]), ignore_index=True) #view updated DataFrame df team points assists rebounds 0 A 18 5.0 11.0 1 B 22 7.0 8.0 2 C 19 7.0 10.0 3 D 14 9.0 6.0 4 E 14 12.0 6.0 5 F 11 9.0 5.0 6 G 20 9.0 9.0 7 H 28 4.0 12.0 8 I 22 8.0 9.0 9 J 30 NaN NaN
Notez que nous ne recevons aucune ValueError et que la nouvelle ligne a été ajoutée à la fin du DataFrame.
Notez également que les deux valeurs manquantes dans la nouvelle ligne ont été simplement remplies avec des valeurs NaN.
Ressources additionnelles
Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes en Python :
Comment réparer : les colonnes se chevauchent mais aucun suffixe n’est spécifié
Comment réparer : l’objet ‘numpy.ndarray’ n’a pas d’attribut ‘append’
Comment réparer : si vous utilisez toutes les valeurs scalaires, vous devez transmettre un index