Comment réparer : ValueError : impossible de définir une ligne avec des colonnes qui ne correspondent pas



Une erreur que vous pouvez rencontrer lors de l’utilisation de pandas est :

ValueError: cannot set a row with mismatched columns

Cette erreur se produit lorsque vous tentez d’ajouter une nouvelle ligne à un DataFrame pandas mais que le nombre de valeurs dans la nouvelle ligne ne correspond pas au nombre de colonnes dans le DataFrame existant.

L’exemple suivant montre comment corriger cette erreur dans la pratique.

Comment reproduire l’erreur

Supposons que nous créions le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28, 22],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4, 8],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12, 9]})

#view DataFrame
df

	team	points	assists	rebounds
0	A	18	5	11
1	B	22	7	8
2	C	19	7	10
3	D	14	9	6
4	E	14	12	6
5	F	11	9	5
6	G	20	9	9
7	H	28	4	12
8	I	22	8	9

Supposons maintenant que nous essayions d’ajouter une nouvelle ligne à la fin du DataFrame :

#define new row to append
new_team = ['J', 30]

#append row to DataFrame
df.loc[len(df)] = new_team

#view updated DataFrame
df

ValueError: cannot set a row with mismatched columns

Nous recevons une ValueError car la nouvelle ligne que nous essayons d’ajouter ne contient que deux valeurs, mais le DataFrame existant comporte quatre colonnes.

Comment réparer l’erreur

Le moyen le plus simple de corriger cette erreur est d’utiliser la fonction append() pour ajouter la nouvelle ligne à la fin du DataFrame, qui remplira automatiquement les valeurs manquantes avec NaN :

La syntaxe suivante montre comment utiliser cette fonction en pratique :

#define new row to append
new = ['J', 30]

#append row to end of DataFrame
df = df.append(pd.Series(new, index=df.columns[:len(new)]), ignore_index=True)

#view updated DataFrame
df

	team	points	assists	rebounds
0	A	18	5.0	11.0
1	B	22	7.0	8.0
2	C	19	7.0	10.0
3	D	14	9.0	6.0
4	E	14	12.0	6.0
5	F	11	9.0	5.0
6	G	20	9.0	9.0
7	H	28	4.0	12.0
8	I	22	8.0	9.0
9	J	30	NaN	NaN

Notez que nous ne recevons aucune ValueError et que la nouvelle ligne a été ajoutée à la fin du DataFrame.

Notez également que les deux valeurs manquantes dans la nouvelle ligne ont été simplement remplies avec des valeurs NaN.

Ressources additionnelles

Les didacticiels suivants expliquent comment corriger d’autres erreurs courantes en Python :

Comment réparer : les colonnes se chevauchent mais aucun suffixe n’est spécifié
Comment réparer : l’objet ‘numpy.ndarray’ n’a pas d’attribut ‘append’
Comment réparer : si vous utilisez toutes les valeurs scalaires, vous devez transmettre un index

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *