Pandas : Comment utiliser la première colonne comme index



Vous pouvez utiliser les méthodes suivantes pour utiliser la première colonne comme colonne d’index dans un DataFrame pandas :

Méthode 1 : utiliser la première colonne comme index lors de l’importation de DataFrame

df = pd.read_csv('my_data.csv', index_col=0)

Méthode 2 : utiliser la première colonne comme index avec un DataFrame existant

df = df.set_index(['column1'])

Les exemples suivants montrent comment utiliser chaque méthode dans la pratique.

Exemple 1 : utiliser la première colonne comme index lors de l’importation de DataFrame

Supposons que nous ayons le fichier CSV suivant appelé my_data.csv :

Si nous importons le fichier CSV sans spécifier de colonne d’index, les pandas créeront simplement une colonne d’index avec des valeurs numériques commençant à 0 :

#import CSV file without specifying index column
df = pd.read_csv('my_data.csv')

#view DataFrame
print(df)

  team  points  assists
0    A      18        5
1    B      22        7
2    C      19        7
3    D      14        9
4    E      14       12
5    F      11        9
6    G      20        9
7    H      28        4

Cependant, nous pouvons utiliser l’argument index_col pour spécifier que la première colonne du fichier CSV doit être utilisée comme colonne d’index :

#import CSV file and specify index column
df = pd.read_csv('my_data.csv', index_col=0)

#view DataFrame
print(df)

      points  assists
team                 
A         18        5
B         22        7
C         19        7
D         14        9
E         14       12
F         11        9
G         20        9
H         28        4

Notez que la colonne équipe est désormais utilisée comme colonne d’index.

Exemple 2 : utiliser la première colonne comme index avec un DataFrame existant

Supposons que nous ayons le DataFrame pandas existant suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

  team  points  assists
0    A      18        5
1    B      22        7
2    C      19        7
3    D      14        9
4    E      14       12
5    F      11        9
6    G      20        9
7    H      28        4

Nous pouvons utiliser la fonction set_index() pour définir la colonne team comme colonne d’index :

#set 'team' column as index column
df = df.set_index(['team'])

#view updated DataFrame
print(df)

      points  assists
team                 
A         18        5
B         22        7
C         19        7
D         14        9
E         14       12
F         11        9
G         20        9
H         28        4

Notez que la colonne équipe est désormais utilisée comme colonne d’index.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :

Comment sélectionner des colonnes par index dans un DataFrame Pandas
Comment renommer l’index dans Pandas DataFrame
Comment supprimer des colonnes par index dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *