Comment créer un DataFrame Pandas à partir d’une chaîne
Vous pouvez utiliser la syntaxe de base suivante pour créer un DataFrame pandas à partir d’une chaîne :
import pandas as pd import io df = pd.read_csv(io.StringIO(string_data), sep=",")
Cette syntaxe particulière crée un DataFrame pandas en utilisant les valeurs contenues dans la chaîne appelée string_data .
Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.
Exemple 1 : créer un DataFrame à partir d’une chaîne avec des séparateurs par virgule
Le code suivant montre comment créer un DataFrame pandas à partir d’une chaîne dans laquelle les valeurs de la chaîne sont séparées par des virgules :
import pandas as pd import io #define string string_data="""points, assists, rebounds 5, 15, 22 7, 12, 9 4, 3, 18 2, 5, 10 3, 11, 5 """ #create pandas DataFrame from string df = pd.read_csv(io.StringIO(string_data), sep=",") #view DataFrame print(df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
Le résultat est un DataFrame pandas avec cinq lignes et trois colonnes.
Exemple 2 : créer un DataFrame à partir d’une chaîne avec des séparateurs de point-virgule
Le code suivant montre comment créer un DataFrame pandas à partir d’une chaîne dans laquelle les valeurs de la chaîne sont séparées par des points-virgules :
import pandas as pd import io #define string string_data="""points;assists;rebounds 5;15;22 7;12;9 4;3;18 2;5;10 3;11;5 """ #create pandas DataFrame from string df = pd.read_csv(io.StringIO(string_data), sep=";") #view DataFrame print(df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
Le résultat est un DataFrame pandas avec cinq lignes et trois colonnes.
Si vous avez une chaîne avec un séparateur différent, utilisez simplement l’argument sep dans la fonction read_csv() pour spécifier le séparateur.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Comment convertir les colonnes Pandas DataFrame en chaînes
Comment convertir l’horodatage en date/heure dans Pandas
Comment convertir DateHeure en date dans Pandas