Comment obtenir les noms de colonnes dans Pandas (3 méthodes)
Vous pouvez utiliser les méthodes suivantes pour obtenir les noms de colonnes dans un DataFrame pandas :
Méthode 1 : obtenir tous les noms de colonnes
list(df)
Méthode 2 : obtenir les noms de colonnes par ordre alphabétique
sorted(df)
Méthode 3 : obtenir les noms de colonnes avec un type de données spécifique
list(df.select_dtypes(include=['int64', 'bool']))
Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F'], 'points': [18, 22, 19, 14, 14, 11], 'assists': [5, 7, 7, 9, 12, 9], 'playoffs': [True, False, False, True, True, True]}) #view DataFrame print(df) team points assists playoffs 0 A 18 5 True 1 B 22 7 False 2 C 19 7 False 3 D 14 9 True 4 E 14 12 True 5 F 11 9 True
Exemple 1 : obtenir tous les noms de colonnes
Le moyen le plus simple d’obtenir tous les noms de colonnes dans un DataFrame pandas est d’utiliser list() comme suit :
#get all column names
list(df)
['team', 'points', 'assists', 'playoffs']
Le résultat est une liste contenant les quatre noms de colonnes du DataFrame pandas.
Exemple 2 : obtenir les noms de colonnes par ordre alphabétique
Pour obtenir les noms de colonnes dans un DataFrame pandas par ordre alphabétique, vous pouvez utiliser la fonction sorted() comme suit :
#get column names in alphabetical order
sorted(df)
['assists', 'playoffs', 'points', 'team']
Le résultat est une liste contenant les quatre noms de colonnes du DataFrame pandas répertoriés par ordre alphabétique.
Vous pouvez également utiliser l’argument reverse=True pour obtenir les noms de colonnes dans l’ordre alphabétique inverse :
#get column names in reverse alphabetical order
sorted(df, reverse=True)
['team', 'points', 'playoffs', 'assists']
Exemple 3 : obtenir des noms de colonnes avec un type de données spécifique
Vous pouvez utiliser la syntaxe suivante pour afficher le type de données de chaque colonne du DataFrame :
#view data type of each column
df.dtypes
team object
points int64
assists int64
playoffs bool
dtype: object
Vous pouvez ensuite utiliser la fonction select_dtypes() pour obtenir uniquement les noms de colonnes avec un type de données spécifique.
Par exemple, nous pouvons utiliser la syntaxe suivante pour obtenir uniquement les noms de colonnes qui ont un type de données int64 ou bool :
#get all columns that have data type of int64 or bool
list(df.select_dtypes(include=['int64', 'bool']))
['points', 'assists', 'playoffs']
Le résultat est une liste de noms de colonnes ayant un type de données int64 ou bool .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Pandas : comment renommer des colonnes
Pandas : Comment définir une colonne comme index
Pandas : obtenir l’index des lignes dont la colonne correspond à la valeur