Comment supprimer des colonnes dans Pandas (4 exemples)



Vous pouvez utiliser la fonction drop() pour supprimer une ou plusieurs colonnes d’un DataFrame pandas :

#drop one column by name
df.drop('column_name', axis=1, inplace=True)

#drop multiple columns by name
df.drop(['column_name1', 'column_name2'], axis=1, inplace=True)

#drop one column by index
df.drop(df.columns[[0]], axis=1, inplace=True)

#drop multiple columns by index
df.drop(df.columns[[0,2,5]], axis=1, inplace=True)

Notez ce qui suit :

  • L’argument axis spécifie s’il faut supprimer des lignes (0) ou des colonnes (1).
  • L’argument inplace spécifie de supprimer les colonnes en place sans réaffecter le DataFrame.

Les exemples suivants montrent comment utiliser cette fonction en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'A': [25, 12, 15, 14, 19, 23, 25, 29],
                   'B': [5, 7, 7, 9, 12, 9, 9, 4],
                   'C': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	A	B	C
0	25	5	11
1	12	7	8
2	15	7	10
3	14	9	6
4	19	12	6
5	23	9	5
6	25	9	9
7	29	4	12

Exemple 1 : supprimer une colonne par nom

Le code suivant montre comment supprimer une colonne du DataFrame par son nom :

#drop column named 'B' from DataFrame
df.drop('B', axis=1, inplace=True) 

#view DataFrame
df

	A	C
0	25	11
1	12	8
2	15	10
3	14	6
4	19	6
5	23	5
6	25	9
7	29	12

Exemple 2 : supprimer plusieurs colonnes par nom

Le code suivant montre comment supprimer plusieurs colonnes par nom :

#drop columns 'A' and 'C' from DataFrame
df.drop(['A', 'C'], axis=1, inplace=True) 

#view DataFrame
df

        B
0	5
1	7
2	7
3	9
4	12
5	9
6	9
7	4

Exemple 3 : supprimer une colonne par index

Le code suivant montre comment supprimer une colonne par index :

#drop first column from DataFrame
df.drop(df.columns[[0]], axis=1, inplace=True) 

#view DataFrame
df

        B	C
0	5	11
1	7	8
2	7	10
3	9	6
4	12	6
5	9	5
6	9	9
7	4	12

Exemple 4 : supprimer plusieurs colonnes par index

Le code suivant montre comment supprimer plusieurs colonnes par index :

#drop multiple columns from DataFrame
df.drop(df.columns[[0, 1]], axis=1, inplace=True) 

#view DataFrame
df

        C
0	11
1	8
2	10
3	6
4	6
5	5
6	9
7	12

Ressources additionnelles

Comment ajouter des lignes à un DataFrame Pandas
Comment ajouter un tableau Numpy à un DataFrame Pandas
Comment compter le nombre de lignes dans Pandas DataFrame

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *