Pandas : comment utiliser read_csv avec l’argument usecols
Vous pouvez utiliser l’argument usecols dans la fonction read_csv() pour lire des colonnes spécifiques d’un fichier CSV dans un DataFrame pandas.
Il existe deux manières courantes d’utiliser cet argument :
Méthode 1 : utiliser usecols avec les noms de colonnes
df = pd.read_csv('my_data.csv', usecols=['this_column', 'that_column'])
Méthode 2 : utiliser usecols avec les positions de colonne
df = pd.read_csv('my_data.csv', usecols=[0, 2])
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le fichier CSV suivant appelé basketball_data.csv :
Exemple 1 : utiliser usecols avec des noms de colonnes
Nous pouvons utiliser le code suivant pour importer le fichier CSV et utiliser uniquement les colonnes appelées « équipe » et « rebonds » :
import pandas as pd #import DataFrame and only use 'team' and 'rebounds' columns df = pd.read_csv('basketball_data.csv', usecols=['team', 'rebounds']) #view DataFrame print(df) team rebounds 0 A 10 1 B 9 2 C 6 3 D 2
Notez que seules les colonnes team et rebonds ont été importées puisqu’il s’agissait des noms des colonnes que nous avons spécifiés dans l’argument usecols .
Exemple 2 : utiliser usecols avec les positions de colonne
Nous pouvons utiliser le code suivant pour importer le fichier CSV et utiliser uniquement les colonnes aux positions d’index 0 et 2 :
import pandas as pd #import DataFrame and only use columns in index positions 0 and 2 df = pd.read_csv('basketball_data.csv', usecols=[0, 2]) #view DataFrame print(df) team rebounds 0 A 10 1 B 9 2 C 6 3 D 2
Notez que seules les colonnes équipe et rebonds ont été importées puisqu’il s’agissait des colonnes aux positions d’index 0 et 2, qui sont les valeurs que nous avons spécifiées dans l’argument usecols .
Remarque : La première colonne du fichier CSV a une position d’index de 0.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :
Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV
Pandas : Comment lire des fichiers Excel
Pandas : Comment exporter un DataFrame vers Excel