Jak utworzyć ramkę danych pandy z ciągu znaków
Aby utworzyć ramkę DataFrame pandy z ciągu znaków, możesz użyć następującej podstawowej składni:
import pandas as pd import io df = pd. read_csv ( io.StringIO (string_data), sep=" , ")
Ta szczególna składnia tworzy pandę DataFrame przy użyciu wartości zawartych w ciągu znaków o nazwie string_data .
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Utwórz ramkę danych z ciągu znaków z separatorami przecinkami
Poniższy kod pokazuje jak utworzyć pandę DataFrame z ciągu znaków, w którym wartości ciągu oddzielane są przecinkami:
import pandas as pd import io #define string string_data="""points, assists, rebounds 5, 15, 22 7, 12, 9 4, 3, 18 2, 5, 10 3, 11, 5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" , ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
Rezultatem jest ramka danych pandy z pięcioma wierszami i trzema kolumnami.
Przykład 2: Utwórz ramkę danych z ciągu znaków z separatorami średników
Poniższy kod pokazuje, jak utworzyć pandę DataFrame z ciągu znaków, w którym wartości ciągu są oddzielone średnikami:
import pandas as pd import io #define string string_data="""points;assists;rebounds 5;15;22 7;12;9 4;3;18 2;5;10 3;11;5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" ; ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
Rezultatem jest ramka danych pandy z pięcioma wierszami i trzema kolumnami.
Jeśli masz ciąg znaków z innym separatorem, po prostu użyj argumentu sep w funkcji read_csv() , aby określić separator.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Jak przekonwertować kolumny Pandas DataFrame na ciągi
Jak przekonwertować znacznik czasu na datę/godzinę w Pandach
Jak przekonwertować DateTime na datę w Pandach