Comment lire un fichier texte avec Pandas (y compris des exemples)



Pour lire un fichier texte avec des pandas en Python, vous pouvez utiliser la syntaxe de base suivante :

df = pd.read_csv("data.txt", sep=" ")

Ce tutoriel fournit plusieurs exemples d’utilisation pratique de cette fonction.

Lire un fichier texte avec un en-tête

Supposons que nous ayons le fichier texte suivant appelé data.txt avec un en-tête :

Lire un fichier texte dans Pandas

Pour lire ce fichier dans un DataFrame pandas, nous pouvons utiliser la syntaxe suivante :

import pandas as pd

#read text file into pandas DataFrame
df = pd.read_csv("data.txt", sep=" ")

#display DataFrame
print(df)

   column1  column2
0        1        4
1        3        4
2        2        5
3        7        9
4        9        1
5        6        3
6        4        4
7        5        2
8        4        8
9        6        8

Nous pouvons imprimer la classe du DataFrame et trouver le nombre de lignes et de colonnes en utilisant la syntaxe suivante :

#display class of DataFrame
print(type(df))

<class 'pandas.core.frame.DataFrame'>

#display number of rows and columns in DataFrame
df.shape

(10, 2)

Nous pouvons voir que df est un DataFrame pandas avec 10 lignes et 2 colonnes.

Lire un fichier texte sans en-tête

Supposons que nous ayons le fichier texte suivant appelé data.txt sans en-tête :

Les pandas lisent un fichier texte sans en-tête

Pour lire ce fichier dans un DataFrame pandas, nous pouvons utiliser la syntaxe suivante :

#read text file into pandas DataFrame
df = pd.read_csv("data.txt", sep=" ", header=None)

#display DataFrame
print(df)

   0  1
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Comme le fichier texte n’avait pas d’en-tête, les pandas ont simplement nommé les colonnes 0 et 1 .

Lire un fichier texte sans en-tête et spécifier les noms de colonnes

Si nous le souhaitons, nous pouvons attribuer des noms de colonnes lors de l’importation du fichier texte en utilisant l’argument noms :

#read text file into pandas DataFrame and specify column names
df = pd.read_csv("data.txt", sep=" ", header=None, names=["A", "B"])

#display DataFrame
print(df)

   A  B
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Ressources additionnelles

Comment lire des fichiers CSV avec Pandas
Comment lire des fichiers Excel avec Pandas
Comment lire un fichier JSON avec Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *