Pandas : Comment utiliser la première colonne comme index
Vous pouvez utiliser les méthodes suivantes pour utiliser la première colonne comme colonne d’index dans un DataFrame pandas :
Méthode 1 : utiliser la première colonne comme index lors de l’importation de DataFrame
df = pd.read_csv('my_data.csv', index_col=0)
Méthode 2 : utiliser la première colonne comme index avec un DataFrame existant
df = df.set_index(['column1'])
Les exemples suivants montrent comment utiliser chaque méthode dans la pratique.
Exemple 1 : utiliser la première colonne comme index lors de l’importation de DataFrame
Supposons que nous ayons le fichier CSV suivant appelé my_data.csv :
Si nous importons le fichier CSV sans spécifier de colonne d’index, les pandas créeront simplement une colonne d’index avec des valeurs numériques commençant à 0 :
#import CSV file without specifying index column df = pd.read_csv('my_data.csv') #view DataFrame print(df) team points assists 0 A 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7 H 28 4
Cependant, nous pouvons utiliser l’argument index_col pour spécifier que la première colonne du fichier CSV doit être utilisée comme colonne d’index :
#import CSV file and specify index column df = pd.read_csv('my_data.csv', index_col=0) #view DataFrame print(df) points assists team A 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Notez que la colonne équipe est désormais utilisée comme colonne d’index.
Exemple 2 : utiliser la première colonne comme index avec un DataFrame existant
Supposons que nous ayons le DataFrame pandas existant suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], 'points': [18, 22, 19, 14, 14, 11, 20, 28], 'assists': [5, 7, 7, 9, 12, 9, 9, 4]}) #view DataFrame df team points assists 0 A 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7 H 28 4
Nous pouvons utiliser la fonction set_index() pour définir la colonne team comme colonne d’index :
#set 'team' column as index column df = df.set_index(['team']) #view updated DataFrame print(df) points assists team A 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Notez que la colonne équipe est désormais utilisée comme colonne d’index.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Comment sélectionner des colonnes par index dans un DataFrame Pandas
Comment renommer l’index dans Pandas DataFrame
Comment supprimer des colonnes par index dans Pandas