Comment créer une colonne en double dans Pandas DataFrame



Vous pouvez utiliser la syntaxe de base suivante pour créer une colonne en double dans un DataFrame pandas :

df['my_column_duplicate'] = df.loc[:, 'my_column']

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : créer une colonne en double dans Pandas DataFrame

Supposons que nous ayons le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29, 32],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4, 5],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12, 8]})

#view DataFrame
print(df)

   points  assists  rebounds
0      25        5        11
1      12        7         8
2      15        7        10
3      14        9         6
4      19       12         6
5      23        9         5
6      25        9         9
7      29        4        12
8      32        5         8

Nous pouvons utiliser le code suivant pour créer un double de la colonne points et le nommer points_duplicate :

#create duplicate points column
df['points_duplicate'] = df.loc[:, 'points']

#view updated DataFrame
print(df)

   points  assists  rebounds  points_duplicate
0      25        5        11                25
1      12        7         8                12
2      15        7        10                15
3      14        9         6                14
4      19       12         6                19
5      23        9         5                23
6      25        9         9                25
7      29        4        12                29
8      32        5         8                32

Notez que la colonne points_duplicate contient exactement les mêmes valeurs que la colonne points .

Notez que la colonne en double doit avoir un nom de colonne différent de celui de la colonne d’origine, sinon une colonne en double ne sera pas créée.

Par exemple, si nous essayons d’utiliser le code suivant pour créer une colonne en double, cela ne fonctionnera pas :

#attempt to create duplicate points column
df['points'] = df.loc[:, 'points']

#view updated DataFrame
print(df)

   points  assists  rebounds
0      25        5        11
1      12        7         8
2      15        7        10
3      14        9         6
4      19       12         6
5      23        9         5
6      25        9         9
7      29        4        12
8      32        5         8

Aucune colonne en double n’a été créée.

La colonne en double doit avoir un nom de colonne différent de celui de la colonne d’origine.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment imprimer le DataFrame Pandas sans index
Comment afficher toutes les lignes d’un DataFrame Pandas
Comment vérifier le type de toutes les colonnes dans Pandas DataFrame

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *