Pandas : définir les noms de colonnes lors de l’importation d’un fichier CSV



Vous pouvez utiliser la syntaxe de base suivante pour définir les noms de colonnes d’un DataFrame lors de l’importation d’un fichier CSV dans pandas :

colnames = ['col1', 'col2', 'col3']

df = pd.read_csv('my_data.csv', names=colnames)

L’argument noms prend une liste de noms que vous souhaitez utiliser pour les colonnes du DataFrame.

En utilisant cet argument, vous dites également aux pandas d’utiliser la première ligne du fichier CSV comme première ligne du DataFrame au lieu de l’utiliser comme ligne d’en-tête.

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : définir les noms de colonnes lors de l’importation d’un fichier CSV dans Pandas

Supposons que nous ayons le fichier CSV suivant appelé Players_data.csv :

À partir du fichier, nous pouvons voir que la première ligne ne contient aucun nom de colonne.

Si nous importons le fichier CSV à l’aide de la fonction read_csv() , les pandas tenteront d’utiliser les valeurs de la première ligne comme noms de colonnes pour le DataFrame :

import pandas as pd

#import CSV file
df = pd.read_csv('players_data.csv')

#view resulting DataFrame
print(df)

   A  22  10
0  B  14   9
1  C  29   6
2  D  30   2
3  E  22   9
4  F  31  10

Cependant, nous pouvons utiliser l’argument noms pour spécifier nos propres noms de colonnes lors de l’importation du fichier CSV :

import pandas as pd

#specify column names
colnames = ['team', 'points', 'rebounds']

#import CSV file and use specified column names
df = pd.read_csv('players_data.csv', names=colnames)

#view resulting DataFrame
print(df)

  team  points  rebounds
0    A      22        10
1    B      14         9
2    C      29         6
3    D      30         2
4    E      22         9
5    F      31        10

Notez que la première ligne du fichier CSV n’est plus utilisée comme ligne d’en-tête.

Au lieu de cela, les noms de colonnes que nous avons spécifiés à l’aide de l’argument noms sont désormais utilisés comme noms de colonnes.

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas read_csv() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :

Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV
Pandas : Comment ajouter des données à un fichier CSV existant
Pandas : comment utiliser read_csv avec l’argument usecols

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *