Pandas : Comment lire uniquement des lignes spécifiques à partir d’un fichier CSV
Vous pouvez utiliser la syntaxe de base suivante pour lire uniquement des lignes spécifiques d’un fichier CSV dans un DataFrame pandas :
#specify rows to import
specific_rows = [0,2,3]
#import specific rows from CSV into DataFrame
df = pd.read_csv('my_data.csv', skiprows = lambda x: x not in specific_rows)
Cet exemple particulier lira les lignes aux positions d’index 0, 2 et 3 à partir d’un fichier CSV appelé my_data.csv dans un DataFrame pandas.
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : lire uniquement des lignes spécifiques d’un fichier CSV dans Pandas
Supposons que nous ayons le fichier CSV suivant appelé basketball_data.csv :
Si nous utilisons la fonction read_csv() , les pandas importeront automatiquement chaque ligne du fichier CSV dans un DataFrame :
import pandas as pd #import all rows of CSV into DataFrame df = pd.read_csv('basketball_data.csv') #view DataFrame print(df) team points rebounds 0 A 22 10 1 B 14 9 2 C 29 6 3 D 30 2
Cependant, nous pouvons utiliser la syntaxe suivante pour importer uniquement les lignes aux positions d’index 0, 2 et 3 du fichier CSV dans un DataFrame pandas :
import pandas as pd #specify rows to import specific_rows = [0,2,3] #import specific rows from CSV into DataFrame df = pd.read_csv('basketball_data.csv', skiprows = lambda x: x not in specific_rows) #view DataFrame print(df) team points rebounds 0 B 14 9 1 C 29 6
Notez que seules les lignes aux positions d’index 0, 2 et 3 du fichier CSV sont importées dans le DataFrame.
Cette syntaxe utilise l’argument skiprows et une fonction lambda pour indiquer aux pandas quelles lignes ne doivent pas sauter lors de l’importation du fichier CSV.
Dans cet exemple, nous disons aux pandas de ne pas ignorer les lignes des positions d’index 0, 2 et 3, mais d’ignorer toutes les autres lignes lors de l’importation du fichier CSV.
Remarque : Vous pouvez trouver la documentation complète de la fonction pandas read_csv() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :
Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV
Pandas : Comment ajouter des données à un fichier CSV existant
Pandas : Comment spécifier les types lors de l’importation d’un fichier CSV
Pandas : Comment définir les noms de colonnes lors de l’importation d’un fichier CSV