Comment créer une colonne en double dans Pandas DataFrame
Vous pouvez utiliser la syntaxe de base suivante pour créer une colonne en double dans un DataFrame pandas :
df['my_column_duplicate'] = df.loc[:, 'my_column']
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : créer une colonne en double dans Pandas DataFrame
Supposons que nous ayons le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29, 32], 'assists': [5, 7, 7, 9, 12, 9, 9, 4, 5], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12, 8]}) #view DataFrame print(df) points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 5 23 9 5 6 25 9 9 7 29 4 12 8 32 5 8
Nous pouvons utiliser le code suivant pour créer un double de la colonne points et le nommer points_duplicate :
#create duplicate points column
df['points_duplicate'] = df.loc[:, 'points']
#view updated DataFrame
print(df)
points assists rebounds points_duplicate
0 25 5 11 25
1 12 7 8 12
2 15 7 10 15
3 14 9 6 14
4 19 12 6 19
5 23 9 5 23
6 25 9 9 25
7 29 4 12 29
8 32 5 8 32
Notez que la colonne points_duplicate contient exactement les mêmes valeurs que la colonne points .
Notez que la colonne en double doit avoir un nom de colonne différent de celui de la colonne d’origine, sinon une colonne en double ne sera pas créée.
Par exemple, si nous essayons d’utiliser le code suivant pour créer une colonne en double, cela ne fonctionnera pas :
#attempt to create duplicate points column
df['points'] = df.loc[:, 'points']
#view updated DataFrame
print(df)
points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6
5 23 9 5
6 25 9 9
7 29 4 12
8 32 5 8
Aucune colonne en double n’a été créée.
La colonne en double doit avoir un nom de colonne différent de celui de la colonne d’origine.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment imprimer le DataFrame Pandas sans index
Comment afficher toutes les lignes d’un DataFrame Pandas
Comment vérifier le type de toutes les colonnes dans Pandas DataFrame