Comment obtenir les noms de colonnes dans Pandas (3 méthodes)



Vous pouvez utiliser les méthodes suivantes pour obtenir les noms de colonnes dans un DataFrame pandas :

Méthode 1 : obtenir tous les noms de colonnes

list(df)

Méthode 2 : obtenir les noms de colonnes par ordre alphabétique

sorted(df)

Méthode 3 : obtenir les noms de colonnes avec un type de données spécifique

list(df.select_dtypes(include=['int64', 'bool']))

Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F'],
                   'points': [18, 22, 19, 14, 14, 11],
                   'assists': [5, 7, 7, 9, 12, 9],
                   'playoffs': [True, False, False, True, True, True]})

#view DataFrame
print(df)

  team  points  assists  playoffs
0    A      18        5      True
1    B      22        7     False
2    C      19        7     False
3    D      14        9      True
4    E      14       12      True
5    F      11        9      True

Exemple 1 : obtenir tous les noms de colonnes

Le moyen le plus simple d’obtenir tous les noms de colonnes dans un DataFrame pandas est d’utiliser list() comme suit :

#get all column names
list(df)

['team', 'points', 'assists', 'playoffs']

Le résultat est une liste contenant les quatre noms de colonnes du DataFrame pandas.

Exemple 2 : obtenir les noms de colonnes par ordre alphabétique

Pour obtenir les noms de colonnes dans un DataFrame pandas par ordre alphabétique, vous pouvez utiliser la fonction sorted() comme suit :

#get column names in alphabetical order
sorted(df)

['assists', 'playoffs', 'points', 'team']

Le résultat est une liste contenant les quatre noms de colonnes du DataFrame pandas répertoriés par ordre alphabétique.

Vous pouvez également utiliser l’argument reverse=True pour obtenir les noms de colonnes dans l’ordre alphabétique inverse :

#get column names in reverse alphabetical order
sorted(df, reverse=True)

['team', 'points', 'playoffs', 'assists']

Exemple 3 : obtenir des noms de colonnes avec un type de données spécifique

Vous pouvez utiliser la syntaxe suivante pour afficher le type de données de chaque colonne du DataFrame :

#view data type of each column
df.dtypes

team        object
points       int64
assists      int64
playoffs      bool
dtype: object

Vous pouvez ensuite utiliser la fonction select_dtypes() pour obtenir uniquement les noms de colonnes avec un type de données spécifique.

Par exemple, nous pouvons utiliser la syntaxe suivante pour obtenir uniquement les noms de colonnes qui ont un type de données int64 ou bool :

#get all columns that have data type of int64 or bool
list(df.select_dtypes(include=['int64', 'bool']))

['points', 'assists', 'playoffs']

Le résultat est une liste de noms de colonnes ayant un type de données int64 ou bool .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : comment renommer des colonnes
Pandas : Comment définir une colonne comme index
Pandas : obtenir l’index des lignes dont la colonne correspond à la valeur

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *