Pandas : Comment définir une colonne comme index



Vous pouvez utiliser la syntaxe suivante pour définir une colonne dans un DataFrame pandas comme index :

#set one column as index
df.set_index('col1')

#set multiple columns as multi index
df.set_index(['col1', 'col2'])

Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le DataFrame suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'points': [5, 7, 7, 9, 12, 9],
                   'assists': [11, 8, 10, 6, 6, 5],
                   'team': ['A', 'B', 'C', 'D', 'E', 'F'],
                   'conference': [1, 2, 3, 4, 5, 6]})

#view DataFrame
df

	points	assists	team	conference
0	5	11	A	1
1	7	8	B	2
2	7	10	C	3
3	9	6	D	4
4	12	6	E	5
5	9	5	F	6

Exemple 1 : définir une colonne comme index

Le code suivant montre comment définir une colonne du DataFrame pandas comme index :

df.set_index('team')

	points	assists	conference
team			
A	5	11	1
B	7	8	2
C	7	10	3
D	9	6	4
E	12	6	5
F	9	5	6

Exemple 2 : définir plusieurs colonnes comme index

Le code suivant montre comment définir plusieurs colonnes du DataFrame pandas en tant que multi-index : :

df.set_index(['team', 'conference'])

		   points  assists
team	conference		
A	1	   5	   11
B	2	   7	   8
C	3	   7	   10
D	4	   9	   6
E	5	   12	   6
F	6	   9	   5

Ressources additionnelles

Comment renommer l’index dans Pandas DataFrame
Comment supprimer des lignes par index dans Pandas
Comment supprimer des colonnes par index dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *