Pandas : Comment créer un DataFrame vide avec des noms de colonnes
Vous pouvez utiliser la syntaxe de base suivante pour créer un DataFrame pandas vide avec des noms de colonnes spécifiques :
df = pd.DataFrame(columns=['Col1', 'Col2', 'Col3'])
Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.
Exemple 1 : créer un DataFrame avec des noms de colonnes et aucune ligne
Le code suivant montre comment créer un DataFrame pandas avec des noms de colonnes spécifiques et aucune ligne :
import pandas as pd #create DataFrame df = pd.DataFrame(columns=['A', 'B', 'C', 'D', 'E']) #view DataFrame df A B C D E
Nous pouvons utiliser shape pour obtenir la taille du DataFrame :
#display shape of DataFrame
df.shape
(0, 5)
Cela nous indique que le DataFrame a 0 ligne et 5 colonnes.
Nous pouvons également utiliser list() pour obtenir une liste des noms de colonnes :
#display list of column names
list(df)
['A', 'B', 'C', 'D', 'E']
Exemple 2 : créer un DataFrame avec des noms de colonnes et un nombre spécifique de lignes
Le code suivant montre comment créer un DataFrame pandas avec des noms de colonnes spécifiques et un nombre spécifique de lignes :
import pandas as pd #create DataFrame df = pd.DataFrame(columns=['A', 'B', 'C', 'D', 'E'], index=range(1, 10)) #view DataFrame df A B C D E 1 NaN NaN NaN NaN NaN 2 NaN NaN NaN NaN NaN 3 NaN NaN NaN NaN NaN 4 NaN NaN NaN NaN NaN 5 NaN NaN NaN NaN NaN 6 NaN NaN NaN NaN NaN 7 NaN NaN NaN NaN NaN 8 NaN NaN NaN NaN NaN 9 NaN NaN NaN NaN NaN
Notez que chaque valeur du DataFrame est remplie avec une valeur NaN.
Encore une fois, nous pouvons utiliser shape pour obtenir la taille du DataFrame :
#display shape of DataFrame
df.shape
(9, 5)
Cela nous indique que le DataFrame comporte 9 lignes et 5 colonnes.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment créer une nouvelle colonne basée sur la condition dans Pandas
Comment insérer une colonne dans un DataFrame Pandas
Comment définir la colonne comme index dans Pandas