Pandas : ignorer la première colonne lors de l’importation d’un fichier CSV

Par Dr. Benjamin Anderson juillet 13, 2023 Guide 0 commentaire

Vous pouvez utiliser la syntaxe de base suivante pour ignorer la première colonne lors de l’importation d’un fichier CSV dans un DataFrame pandas :

with open('basketball_data.csv') as x:
    ncols = len(x.readline().split(','))

df = pd.read_csv('basketball_data.csv', usecols=range(1,ncols))

Cet exemple particulier lira chaque colonne d’un fichier CSV appelé basketball_data.csv dans un DataFrame pandas, à l’exception de la première colonne.

À l’aide de ce code, nous trouvons d’abord le nombre de colonnes dans le fichier CSV et l’attribuons à une variable appelée ncols .

Ensuite, nous utilisons l’argument usecols pour spécifier que nous souhaitons importer uniquement les colonnes comprises entre 1 (c’est-à-dire la deuxième colonne) et la dernière colonne du fichier CSV.

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : ignorer la première colonne lors de l’importation d’un fichier CSV dans Pandas

Supposons que nous ayons le fichier CSV suivant appelé basketball_data.csv :

Nous pouvons utiliser la syntaxe suivante pour importer le fichier CSV dans un DataFrame pandas et ignorer la première colonne :

import pandas as pd

#calculate number of columns in CSV file
with open('basketball_data.csv') as x:
    ncols = len(x.readline().split(','))

#import all columns except first column into DataFrame
df = pd.read_csv('basketball_data.csv', usecols=range(1,ncols))

#view resulting DataFrame
print(df)

   points  rebounds
0      22        10
1      14         9
2      29         6
3      30         2

Notez que la première colonne appelée team a été supprimée lorsque nous avons importé le fichier CSV dans pandas.

Notez que si vous connaissez déjà à l’avance le nombre total de colonnes dans le fichier CSV, vous pouvez directement fournir cette valeur à l’argument usecols .

Par exemple, supposons que nous sachions déjà qu’il y a trois colonnes dans le fichier CVS.

Nous pourrions utiliser la syntaxe suivante pour importer le fichier CSV dans un DataFrame pandas et ignorer la première colonne :

import pandas as pd

#import all columns except first column into DataFrame
df = pd.read_csv('basketball_data.csv', usecols=range(1,3))

#view resulting DataFrame
print(df)

   points  rebounds
0      22        10
1      14         9
2      29         6
3      30         2

Notez que la première colonne appelée team a été supprimée lorsque nous avons importé le fichier CSV dans pandas.

Puisque nous savions déjà qu’il y avait trois colonnes dans le fichier CSV, nous avons simplement utilisé range(1,3) dans l’argument usecols .

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas read_csv() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :

Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV
Pandas : Comment ajouter des données à un fichier CSV existant
Pandas : comment utiliser read_csv avec l’argument usecols

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus

Exemple : ignorer la première colonne lors de l’importation d’un fichier CSV dans Pandas

Ressources additionnelles

à propos de l'auteur

Dr. Benjamin Anderson

Ajouter un commentaire