Jak odczytać plik csv z ciągu w pandas dataframe


Aby odczytać plik CSV z ciągu znaków w ramce DataFrame pandy, możesz użyć następującej podstawowej składni:

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

Poniższe przykłady pokazują, jak używać tej składni w praktyce.

Przykład 1: Odczytaj plik CSV z ciągu znaków z przecinkami jako separatorami

Poniższy kod pokazuje, jak odczytać plik CSV z ciągu znaków (z przecinkami jako separatorami) do ramki DataFrame pandy:

 import pandas as pd
import io   

some_string="""team,points,rebounds
A,22,10
B,14.9
C,29.6
D,30.2
E,22.9
F,31.10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Powstała panda DataFrame zawiera wartości z ciągu CSV.

Przykład 2: Odczytaj plik CSV z ciągu znaków ze średnikiem jako separatorem

Poniższy kod pokazuje, jak odczytać plik CSV z ciągu znaków (ze średnikami jako separatorami) do ramki DataFrame pandy:

 import pandas as pd
import io   

some_string="""team;points;rebounds
A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" ; ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Powstała panda DataFrame zawiera wartości z ciągu CSV.

Przykład 3: Odczytaj plik CSV z ciągu znaków bez nagłówka

Poniższy kod pokazuje, jak odczytać plik CSV z ciągu znaków (bez wiersza nagłówka) do ramki DataFrame pandy:

 import pandas as pd
import io   

some_string="""A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None )

#view resulting DataFrame
print (df)

   0 1 2
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Używając argumentu header=None , powiedzieliśmy pandom, aby nie używały pierwszej linii jako linii nagłówka.

Domyślnie pandy używają zakresu wartości numerycznych (0, 1, 2) jako nazw kolumn dla DataFrame.

Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:

Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: Jak odczytać plik CSV bez nagłówka
Pandy: ustaw nazwy kolumn podczas importowania pliku CSV

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *