Hoe een csv-bestand uit een string in pandas dataframe te lezen
U kunt de volgende basissyntaxis gebruiken om een CSV-bestand te lezen uit een tekenreeks in een Panda DataFrame:
import pandas as pd import io df = pd. read_csv ( io.StringIO (some_string), sep=" , ")
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: Lees een CSV-bestand uit een string met komma’s als scheidingstekens
De volgende code laat zien hoe u een CSV-bestand uit een tekenreeks (met komma’s als scheidingstekens) in een pandas DataFrame leest:
import pandas as pd import io some_string="""team,points,rebounds A,22,10 B,14.9 C,29.6 D,30.2 E,22.9 F,31.10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" , ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Het resulterende panda’s DataFrame bevat de waarden uit de CSV-string.
Voorbeeld 2: Lees een CSV-bestand uit een string met een puntkomma als scheidingsteken
De volgende code laat zien hoe u een CSV-bestand uit een tekenreeks (met puntkomma’s als scheidingstekens) leest in een Panda’s DataFrame:
import pandas as pd import io some_string="""team;points;rebounds A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" ; ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Het resulterende panda’s DataFrame bevat de waarden uit de CSV-string.
Voorbeeld 3: Lees een CSV-bestand uit een headerloze string
De volgende code laat zien hoe u een CSV-bestand uit een tekenreeks (zonder koprij) in een pandas DataFrame leest:
import pandas as pd import io some_string="""A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Door het header=None- argument te gebruiken, hebben we panda’s verteld de eerste regel niet als kopregel te gebruiken.
Standaard gebruikt Panda een bereik van numerieke waarden (0, 1, 2) als kolomnamen voor het DataFrame.
Opmerking : u kunt de volledige documentatie van de pandas read_csv() functie hier vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Python kunt uitvoeren:
Panda’s: regels overslaan bij het lezen van een CSV-bestand
Panda’s: gegevens toevoegen aan een bestaand CSV-bestand
Panda’s: een CSV-bestand lezen zonder header
Panda’s: stel kolomnamen in bij het importeren van een CSV-bestand