Pandas : définir les noms de colonnes lors de l’importation d’un fichier CSV
Vous pouvez utiliser la syntaxe de base suivante pour définir les noms de colonnes d’un DataFrame lors de l’importation d’un fichier CSV dans pandas :
colnames = ['col1', 'col2', 'col3'] df = pd.read_csv('my_data.csv', names=colnames)
L’argument noms prend une liste de noms que vous souhaitez utiliser pour les colonnes du DataFrame.
En utilisant cet argument, vous dites également aux pandas d’utiliser la première ligne du fichier CSV comme première ligne du DataFrame au lieu de l’utiliser comme ligne d’en-tête.
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : définir les noms de colonnes lors de l’importation d’un fichier CSV dans Pandas
Supposons que nous ayons le fichier CSV suivant appelé Players_data.csv :
À partir du fichier, nous pouvons voir que la première ligne ne contient aucun nom de colonne.
Si nous importons le fichier CSV à l’aide de la fonction read_csv() , les pandas tenteront d’utiliser les valeurs de la première ligne comme noms de colonnes pour le DataFrame :
import pandas as pd #import CSV file df = pd.read_csv('players_data.csv') #view resulting DataFrame print(df) A 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
Cependant, nous pouvons utiliser l’argument noms pour spécifier nos propres noms de colonnes lors de l’importation du fichier CSV :
import pandas as pd #specify column names colnames = ['team', 'points', 'rebounds'] #import CSV file and use specified column names df = pd.read_csv('players_data.csv', names=colnames) #view resulting DataFrame print(df) team points rebounds 0 A 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Notez que la première ligne du fichier CSV n’est plus utilisée comme ligne d’en-tête.
Au lieu de cela, les noms de colonnes que nous avons spécifiés à l’aide de l’argument noms sont désormais utilisés comme noms de colonnes.
Remarque : Vous pouvez trouver la documentation complète de la fonction pandas read_csv() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :
Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV
Pandas : Comment ajouter des données à un fichier CSV existant
Pandas : comment utiliser read_csv avec l’argument usecols