Comment créer un tuple à partir de deux colonnes dans Pandas



Vous pouvez utiliser la syntaxe de base suivante pour créer un tuple à partir de deux colonnes dans un DataFrame pandas :

df['new_column'] = list(zip(df.column1, df.column2))

Cette formule particulière crée une nouvelle colonne appelée new_column , qui est un tuple formé par column1 et column2 dans le DataFrame.

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : créer un tuple à partir de deux colonnes dans Pandas

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur divers joueurs de basket-ball :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print(df)

  team  points  assists
0    A      18        5
1    B      22        7
2    C      19        7
3    D      14        9
4    E      14       12
5    F      11        9
6    G      20        9
7    H      28        4

Nous pouvons utiliser la syntaxe suivante pour créer une nouvelle colonne appelée points_assistes , qui est un tuple formé par les valeurs des colonnes points et assists :

#create new column that is a tuple of points and assists columns
df['points_assists'] = list(zip(df.points, df.assists))

#view updated DataFrame
print(df)

  team  points  assists points_assists
0    A      18        5        (18, 5)
1    B      22        7        (22, 7)
2    C      19        7        (19, 7)
3    D      14        9        (14, 9)
4    E      14       12       (14, 12)
5    F      11        9        (11, 9)
6    G      20        9        (20, 9)
7    H      28        4        (28, 4)

La nouvelle colonne appelée points_assistes est un tuple formé par les colonnes points et assistances .

Notez que vous pouvez également inclure plus de deux colonnes dans un tuple si vous le souhaitez.

Par exemple, le code suivant montre comment créer un tuple qui utilise les valeurs des trois colonnes d’origine du DataFrame :

#create new column that is a tuple of team, points and assists columns
df['all_columns'] = list(zip(df.team, df.points, df.assists))

#view updated DataFrame
print(df)

  team  points  assists  all_columns
0    A      18        5   (A, 18, 5)
1    B      22        7   (B, 22, 7)
2    C      19        7   (C, 19, 7)
3    D      14        9   (D, 14, 9)
4    E      14       12  (E, 14, 12)
5    F      11        9   (F, 11, 9)
6    G      20        9   (G, 20, 9)
7    H      28        4   (H, 28, 4)

Vous pouvez utiliser cette même syntaxe de base pour créer une colonne de tuple avec autant de colonnes que vous le souhaitez.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment supprimer les lignes en double dans Pandas
Comment supprimer les colonnes en double dans Pandas
Comment compter les doublons chez les pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *