Pandas : Comment vérifier le type de toutes les colonnes dans DataFrame
Vous pouvez utiliser les méthodes suivantes pour vérifier le type de données ( dtype ) des colonnes d’un DataFrame pandas :
Méthode 1 : vérifier le type d’une colonne
df.column_name.dtype
Méthode 2 : vérifier le type de toutes les colonnes
df.dtypes
Méthode 3 : Vérifiez quelles colonnes ont un type spécifique
df.dtypes[df.dtypes == 'int64']
Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F'], 'points': [18, 22, 19, 14, 14, 11], 'assists': [5, 7, 7, 9, 12, 9], 'all_star': [True, False, False, True, True, True]}) #view DataFrame print(df) team points assists all_star 0 A 18 5 True 1 B 22 7 False 2 C 19 7 False 3 D 14 9 True 4 E 14 12 True 5 F 11 9 True
Exemple 1 : vérifier le type d’une colonne
Nous pouvons utiliser la syntaxe suivante pour vérifier le type de données uniquement de la colonne de points dans le DataFrame :
#check dtype of points column df.points.dtype dtype('int64')
À partir du résultat, nous pouvons voir que la colonne de points a un type de données entier.
Exemple 2 : vérifier le type de toutes les colonnes
Nous pouvons utiliser la syntaxe suivante pour vérifier le type de données de toutes les colonnes du DataFrame :
#check dtype of all columns df.dtypes team object points int64 assists int64 all_star bool dtype: object
À partir du résultat, nous pouvons voir :
- colonne équipe : objet (c’est la même chose qu’une chaîne)
- colonne de points : entier
- colonne d’assistance : entier
- Colonne all_star : booléen
En utilisant cette seule ligne de code, nous pouvons voir le type de données de chaque colonne du DataFrame.
Exemple 3 : Vérifiez quelles colonnes ont un type spécifique
Nous pouvons utiliser la syntaxe suivante pour vérifier quelles colonnes du DataFrame ont un type de données int64 :
#show all columns that have a class of int64
df.dtypes[df.dtypes == 'int64']
points int64
assists int64
dtype: object
À partir du résultat, nous pouvons voir que les colonnes de points et d’assistances ont toutes deux un type de données int64.
Nous pouvons utiliser une syntaxe similaire pour vérifier quelles colonnes ont d’autres types de données.
Par exemple, nous pouvons utiliser la syntaxe suivante pour vérifier quelles colonnes du DataFrame ont un type de données d’objet :
#show all columns that have a class of object (i.e. string)
df.dtypes[df.dtypes == 'O']
team object
dtype: object
Nous pouvons voir que seule la colonne équipe a un type de données « O », qui signifie objet.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes sur les DataFrames pandas :
Pandas : Comment obtenir la valeur d’une cellule à partir de DataFrame
Pandas : obtenir l’index des lignes dont la colonne correspond à la valeur
Pandas : Comment définir une colonne comme index