Comment conserver certaines colonnes dans Pandas (avec exemples)



Vous pouvez utiliser les méthodes suivantes pour conserver uniquement certaines colonnes dans un DataFrame pandas :

Méthode 1 : spécifier les colonnes à conserver

#only keep columns 'col1' and 'col2'
df[['col1', 'col2']]

Méthode 2 : spécifier les colonnes à supprimer

#drop columns 'col3' and 'col4'
df[df.columns[~df.columns.isin(['col3', 'col4'])]]

Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'B'],
                   'points': [11, 7, 8, 10, 13, 13],
                   'assists': [5, 7, 7, 9, 12, 9],
                   'rebounds': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team	points	assists	rebounds
0	A	11	5	11
1	A	7	7	8
2	A	8	7	10
3	B	10	9	6
4	B	13	12	6
5	B	13	9	5

Méthode 1 : spécifier les colonnes à conserver

Le code suivant montre comment définir un nouveau DataFrame qui ne conserve que les colonnes « team » et « points » :

#create new DataFrame and only keep 'team' and 'points' columns
df2 = df[['team', 'points']]

#view new DataFrame
df2

        team	points
0	A	11
1	A	7
2	A	8
3	B	10
4	B	13
5	B	13

Notez que le DataFrame résultant ne conserve que les deux colonnes que nous avons spécifiées.

Méthode 2 : spécifier les colonnes à supprimer

Le code suivant montre comment définir un nouveau DataFrame qui supprime les colonnes « assistances » et « rebonds » du DataFrame d’origine :

#create new DataFrame and that drops 'assists' and 'rebounds'
df2 = df[df.columns[~df.columns.isin(['assists', 'rebounds'])]]

#view new DataFrame
df2

        team	points
0	A	11
1	A	7
2	A	8
3	B	10
4	B	13
5	B	13

Notez que le DataFrame résultant supprime les colonnes « assistances » et « rebonds » du DataFrame d’origine et conserve les colonnes restantes.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment supprimer la première colonne dans Pandas DataFrame
Comment supprimer les colonnes en double dans Pandas
Comment supprimer des colonnes par index dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *