Pandas : Comment vérifier le type de toutes les colonnes dans DataFrame



Vous pouvez utiliser les méthodes suivantes pour vérifier le type de données ( dtype ) des colonnes d’un DataFrame pandas :

Méthode 1 : vérifier le type d’une colonne

df.column_name.dtype

Méthode 2 : vérifier le type de toutes les colonnes

df.dtypes

Méthode 3 : Vérifiez quelles colonnes ont un type spécifique

df.dtypes[df.dtypes == 'int64']

Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F'],
                   'points': [18, 22, 19, 14, 14, 11],
                   'assists': [5, 7, 7, 9, 12, 9],
                   'all_star': [True, False, False, True, True, True]})

#view DataFrame
print(df)

  team  points  assists  all_star
0    A      18        5      True
1    B      22        7     False
2    C      19        7     False
3    D      14        9      True
4    E      14       12      True
5    F      11        9      True

Exemple 1 : vérifier le type d’une colonne

Nous pouvons utiliser la syntaxe suivante pour vérifier le type de données uniquement de la colonne de points dans le DataFrame :

#check dtype of points column
df.points.dtype

dtype('int64')

À partir du résultat, nous pouvons voir que la colonne de points a un type de données entier.

Exemple 2 : vérifier le type de toutes les colonnes

Nous pouvons utiliser la syntaxe suivante pour vérifier le type de données de toutes les colonnes du DataFrame :

#check dtype of all columns
df.dtypes

team        object
points       int64
assists      int64
all_star      bool
dtype: object

À partir du résultat, nous pouvons voir :

  • colonne équipe : objet (c’est la même chose qu’une chaîne)
  • colonne de points : entier
  • colonne d’assistance : entier
  • Colonne all_star : booléen

En utilisant cette seule ligne de code, nous pouvons voir le type de données de chaque colonne du DataFrame.

Exemple 3 : Vérifiez quelles colonnes ont un type spécifique

Nous pouvons utiliser la syntaxe suivante pour vérifier quelles colonnes du DataFrame ont un type de données int64 :

#show all columns that have a class of int64
df.dtypes[df.dtypes == 'int64']

points     int64
assists    int64
dtype: object

À partir du résultat, nous pouvons voir que les colonnes de points et d’assistances ont toutes deux un type de données int64.

Nous pouvons utiliser une syntaxe similaire pour vérifier quelles colonnes ont d’autres types de données.

Par exemple, nous pouvons utiliser la syntaxe suivante pour vérifier quelles colonnes du DataFrame ont un type de données d’objet :

#show all columns that have a class of object (i.e. string)
df.dtypes[df.dtypes == 'O']

team    object
dtype: object

Nous pouvons voir que seule la colonne équipe a un type de données « O », qui signifie objet.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes sur les DataFrames pandas :

Pandas : Comment obtenir la valeur d’une cellule à partir de DataFrame
Pandas : obtenir l’index des lignes dont la colonne correspond à la valeur
Pandas : Comment définir une colonne comme index

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *