Comment créer un DataFrame Pandas à partir d’une chaîne



Vous pouvez utiliser la syntaxe de base suivante pour créer un DataFrame pandas à partir d’une chaîne :

import pandas as pd
import io   

df = pd.read_csv(io.StringIO(string_data), sep=",")

Cette syntaxe particulière crée un DataFrame pandas en utilisant les valeurs contenues dans la chaîne appelée string_data .

Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.

Exemple 1 : créer un DataFrame à partir d’une chaîne avec des séparateurs par virgule

Le code suivant montre comment créer un DataFrame pandas à partir d’une chaîne dans laquelle les valeurs de la chaîne sont séparées par des virgules :

import pandas as pd
import io

#define string
string_data="""points, assists, rebounds
5, 15, 22
7, 12, 9
4, 3, 18
2, 5, 10
3, 11, 5
"""

#create pandas DataFrame from string
df = pd.read_csv(io.StringIO(string_data), sep=",")

#view DataFrame
print(df)

   points   assists   rebounds
0       5        15         22
1       7        12          9
2       4         3         18
3       2         5         10
4       3        11          5

Le résultat est un DataFrame pandas avec cinq lignes et trois colonnes.

Exemple 2 : créer un DataFrame à partir d’une chaîne avec des séparateurs de point-virgule

Le code suivant montre comment créer un DataFrame pandas à partir d’une chaîne dans laquelle les valeurs de la chaîne sont séparées par des points-virgules :

import pandas as pd
import io

#define string
string_data="""points;assists;rebounds
5;15;22
7;12;9
4;3;18
2;5;10
3;11;5
"""

#create pandas DataFrame from string
df = pd.read_csv(io.StringIO(string_data), sep=";")

#view DataFrame
print(df)

   points   assists   rebounds
0       5        15         22
1       7        12          9
2       4         3         18
3       2         5         10
4       3        11          5

Le résultat est un DataFrame pandas avec cinq lignes et trois colonnes.

Si vous avez une chaîne avec un séparateur différent, utilisez simplement l’argument sep dans la fonction read_csv() pour spécifier le séparateur.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :

Comment convertir les colonnes Pandas DataFrame en chaînes
Comment convertir l’horodatage en date/heure dans Pandas
Comment convertir DateHeure en date dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *