Hoe een csv-bestand uit een string in pandas dataframe te lezen


U kunt de volgende basissyntaxis gebruiken om een CSV-bestand te lezen uit een tekenreeks in een Panda DataFrame:

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Lees een CSV-bestand uit een string met komma’s als scheidingstekens

De volgende code laat zien hoe u een CSV-bestand uit een tekenreeks (met komma’s als scheidingstekens) in een pandas DataFrame leest:

 import pandas as pd
import io   

some_string="""team,points,rebounds
A,22,10
B,14.9
C,29.6
D,30.2
E,22.9
F,31.10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Het resulterende panda’s DataFrame bevat de waarden uit de CSV-string.

Voorbeeld 2: Lees een CSV-bestand uit een string met een puntkomma als scheidingsteken

De volgende code laat zien hoe u een CSV-bestand uit een tekenreeks (met puntkomma’s als scheidingstekens) leest in een Panda’s DataFrame:

 import pandas as pd
import io   

some_string="""team;points;rebounds
A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" ; ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Het resulterende panda’s DataFrame bevat de waarden uit de CSV-string.

Voorbeeld 3: Lees een CSV-bestand uit een headerloze string

De volgende code laat zien hoe u een CSV-bestand uit een tekenreeks (zonder koprij) in een pandas DataFrame leest:

 import pandas as pd
import io   

some_string="""A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None )

#view resulting DataFrame
print (df)

   0 1 2
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Door het header=None- argument te gebruiken, hebben we panda’s verteld de eerste regel niet als kopregel te gebruiken.

Standaard gebruikt Panda een bereik van numerieke waarden (0, 1, 2) als kolomnamen voor het DataFrame.

Opmerking : u kunt de volledige documentatie van de pandas read_csv() functie hier vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Python kunt uitvoeren:

Panda’s: regels overslaan bij het lezen van een CSV-bestand
Panda’s: gegevens toevoegen aan een bestaand CSV-bestand
Panda’s: een CSV-bestand lezen zonder header
Panda’s: stel kolomnamen in bij het importeren van een CSV-bestand

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert