Comment conserver certaines colonnes dans Pandas (avec exemples)
Vous pouvez utiliser les méthodes suivantes pour conserver uniquement certaines colonnes dans un DataFrame pandas :
Méthode 1 : spécifier les colonnes à conserver
#only keep columns 'col1' and 'col2' df[['col1', 'col2']]
Méthode 2 : spécifier les colonnes à supprimer
#drop columns 'col3' and 'col4' df[df.columns[~df.columns.isin(['col3', 'col4'])]]
Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'B'], 'points': [11, 7, 8, 10, 13, 13], 'assists': [5, 7, 7, 9, 12, 9], 'rebounds': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team points assists rebounds 0 A 11 5 11 1 A 7 7 8 2 A 8 7 10 3 B 10 9 6 4 B 13 12 6 5 B 13 9 5
Méthode 1 : spécifier les colonnes à conserver
Le code suivant montre comment définir un nouveau DataFrame qui ne conserve que les colonnes « team » et « points » :
#create new DataFrame and only keep 'team' and 'points' columns
df2 = df[['team', 'points']]
#view new DataFrame
df2
team points
0 A 11
1 A 7
2 A 8
3 B 10
4 B 13
5 B 13
Notez que le DataFrame résultant ne conserve que les deux colonnes que nous avons spécifiées.
Méthode 2 : spécifier les colonnes à supprimer
Le code suivant montre comment définir un nouveau DataFrame qui supprime les colonnes « assistances » et « rebonds » du DataFrame d’origine :
#create new DataFrame and that drops 'assists' and 'rebounds'
df2 = df[df.columns[~df.columns.isin(['assists', 'rebounds'])]]
#view new DataFrame
df2
team points
0 A 11
1 A 7
2 A 8
3 B 10
4 B 13
5 B 13
Notez que le DataFrame résultant supprime les colonnes « assistances » et « rebonds » du DataFrame d’origine et conserve les colonnes restantes.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment supprimer la première colonne dans Pandas DataFrame
Comment supprimer les colonnes en double dans Pandas
Comment supprimer des colonnes par index dans Pandas