Jak odczytać plik csv z ciągu w pandas dataframe
Aby odczytać plik CSV z ciągu znaków w ramce DataFrame pandy, możesz użyć następującej podstawowej składni:
import pandas as pd import io df = pd. read_csv ( io.StringIO (some_string), sep=" , ")
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Odczytaj plik CSV z ciągu znaków z przecinkami jako separatorami
Poniższy kod pokazuje, jak odczytać plik CSV z ciągu znaków (z przecinkami jako separatorami) do ramki DataFrame pandy:
import pandas as pd import io some_string="""team,points,rebounds A,22,10 B,14.9 C,29.6 D,30.2 E,22.9 F,31.10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" , ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Powstała panda DataFrame zawiera wartości z ciągu CSV.
Przykład 2: Odczytaj plik CSV z ciągu znaków ze średnikiem jako separatorem
Poniższy kod pokazuje, jak odczytać plik CSV z ciągu znaków (ze średnikami jako separatorami) do ramki DataFrame pandy:
import pandas as pd import io some_string="""team;points;rebounds A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" ; ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Powstała panda DataFrame zawiera wartości z ciągu CSV.
Przykład 3: Odczytaj plik CSV z ciągu znaków bez nagłówka
Poniższy kod pokazuje, jak odczytać plik CSV z ciągu znaków (bez wiersza nagłówka) do ramki DataFrame pandy:
import pandas as pd import io some_string="""A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Używając argumentu header=None , powiedzieliśmy pandom, aby nie używały pierwszej linii jako linii nagłówka.
Domyślnie pandy używają zakresu wartości numerycznych (0, 1, 2) jako nazw kolumn dla DataFrame.
Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: Jak odczytać plik CSV bez nagłówka
Pandy: ustaw nazwy kolumn podczas importowania pliku CSV