Pandas : ignorer la première colonne lors de l’importation d’un fichier CSV
Vous pouvez utiliser la syntaxe de base suivante pour ignorer la première colonne lors de l’importation d’un fichier CSV dans un DataFrame pandas :
with open('basketball_data.csv') as x: ncols = len(x.readline().split(',')) df = pd.read_csv('basketball_data.csv', usecols=range(1,ncols))
Cet exemple particulier lira chaque colonne d’un fichier CSV appelé basketball_data.csv dans un DataFrame pandas, à l’exception de la première colonne.
À l’aide de ce code, nous trouvons d’abord le nombre de colonnes dans le fichier CSV et l’attribuons à une variable appelée ncols .
Ensuite, nous utilisons l’argument usecols pour spécifier que nous souhaitons importer uniquement les colonnes comprises entre 1 (c’est-à-dire la deuxième colonne) et la dernière colonne du fichier CSV.
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : ignorer la première colonne lors de l’importation d’un fichier CSV dans Pandas
Supposons que nous ayons le fichier CSV suivant appelé basketball_data.csv :
Nous pouvons utiliser la syntaxe suivante pour importer le fichier CSV dans un DataFrame pandas et ignorer la première colonne :
import pandas as pd #calculate number of columns in CSV file with open('basketball_data.csv') as x: ncols = len(x.readline().split(',')) #import all columns except first column into DataFrame df = pd.read_csv('basketball_data.csv', usecols=range(1,ncols)) #view resulting DataFrame print(df) points rebounds 0 22 10 1 14 9 2 29 6 3 30 2
Notez que la première colonne appelée team a été supprimée lorsque nous avons importé le fichier CSV dans pandas.
Notez que si vous connaissez déjà à l’avance le nombre total de colonnes dans le fichier CSV, vous pouvez directement fournir cette valeur à l’argument usecols .
Par exemple, supposons que nous sachions déjà qu’il y a trois colonnes dans le fichier CVS.
Nous pourrions utiliser la syntaxe suivante pour importer le fichier CSV dans un DataFrame pandas et ignorer la première colonne :
import pandas as pd #import all columns except first column into DataFrame df = pd.read_csv('basketball_data.csv', usecols=range(1,3)) #view resulting DataFrame print(df) points rebounds 0 22 10 1 14 9 2 29 6 3 30 2
Notez que la première colonne appelée team a été supprimée lorsque nous avons importé le fichier CSV dans pandas.
Puisque nous savions déjà qu’il y avait trois colonnes dans le fichier CSV, nous avons simplement utilisé range(1,3) dans l’argument usecols .
Remarque : Vous pouvez trouver la documentation complète de la fonction pandas read_csv() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :
Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV
Pandas : Comment ajouter des données à un fichier CSV existant
Pandas : comment utiliser read_csv avec l’argument usecols