Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV



Vous pouvez utiliser les méthodes suivantes pour ignorer des lignes lors de la lecture d’un fichier CSV dans un DataFrame pandas :

Méthode 1 : ignorer une ligne spécifique

#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])

Méthode 2 : ignorer plusieurs lignes spécifiques

#import DataFrame and skip 2nd and 4th row
df = pd.read_csv('my_data.csv', skiprows=[2, 4])

Méthode 3 : ignorer les N premières lignes

#import DataFrame and skip first 2 rows
df = pd.read_csv('my_data.csv', skiprows=2)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le fichier CSV suivant appelé basketball_data.csv :

Exemple 1 : ignorer une ligne spécifique

Nous pouvons utiliser le code suivant pour importer le fichier CSV et ignorer la deuxième ligne :

import pandas as pd

#import DataFrame and skip 2nd row
df = pd.read_csv('basketball_data.csv', skiprows=[2])

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6
2	D	30	2

Notez que la deuxième ligne (avec l’équipe « B ») a été ignorée lors de l’importation du fichier CSV dans le DataFrame pandas.

Remarque : La première ligne du fichier CSV est considérée comme la ligne 0.

Exemple 2 : ignorer plusieurs lignes spécifiques

Nous pouvons utiliser le code suivant pour importer le fichier CSV et ignorer les deuxième et quatrième lignes :

import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd.read_csv('basketball_data.csv', skiprows=[2, 4])

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6

Notez que les deuxième et quatrième lignes (avec les équipes « B » et « D ») ont été ignorées lors de l’importation du fichier CSV dans le DataFrame pandas.

Exemple 3 : ignorer les N premières lignes

Nous pouvons utiliser le code suivant pour importer le fichier CSV et ignorer les deux premières lignes :

import pandas as pd

#import DataFrame and skip first 2 rows
df = pd.read_csv('basketball_data.csv', skiprows=2)

#view DataFrame
df

        B	14	9
0	C	29	6
1	D	30	2

Notez que les deux premières lignes du fichier CSV ont été ignorées et que la ligne disponible suivante (avec l’équipe « B ») est devenue la ligne d’en-tête du DataFrame.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :

Comment lire des fichiers Excel avec Pandas
Comment exporter le DataFrame Pandas vers Excel
Comment exporter un tableau NumPy vers un fichier CSV

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *