Hoe u een pandas dataframe kunt maken op basis van een string
U kunt de volgende basissyntaxis gebruiken om een Panda DataFrame te maken op basis van een tekenreeks:
import pandas as pd import io df = pd. read_csv ( io.StringIO (string_data), sep=" , ")
Deze specifieke syntaxis creëert een panda’s DataFrame met behulp van de waarden in de string genaamd string_data .
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: Maak een DataFrame van een tekenreeks met kommascheidingstekens
De volgende code laat zien hoe u een Panda DataFrame maakt op basis van een string waarin de stringwaarden worden gescheiden door komma’s:
import pandas as pd import io #define string string_data="""points, assists, rebounds 5, 15, 22 7, 12, 9 4, 3, 18 2, 5, 10 3, 11, 5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" , ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
Het resultaat is een Panda DataFrame met vijf rijen en drie kolommen.
Voorbeeld 2: Maak een DataFrame van een tekenreeks met puntkommascheidingstekens
De volgende code laat zien hoe u een Panda DataFrame maakt op basis van een string waarin de stringwaarden worden gescheiden door puntkomma’s:
import pandas as pd import io #define string string_data="""points;assists;rebounds 5;15;22 7;12;9 4;3;18 2;5;10 3;11;5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" ; ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
Het resultaat is een Panda DataFrame met vijf rijen en drie kolommen.
Als je een string hebt met een ander scheidingsteken, gebruik dan gewoon het sep- argument in de read_csv() functie om het scheidingsteken op te geven.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Hoe Pandas DataFrame-kolommen naar strings te converteren
Hoe tijdstempel naar datum/tijd in Panda’s te converteren
Hoe DateTime naar datum te converteren in Pandas