So lesen sie eine csv-datei aus einer zeichenfolge in pandas dataframe
Sie können die folgende grundlegende Syntax verwenden, um eine CSV-Datei aus einer Zeichenfolge in einem Pandas-DataFrame zu lesen:
import pandas as pd import io df = pd. read_csv ( io.StringIO (some_string), sep=" , ")
Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.
Beispiel 1: Lesen Sie eine CSV-Datei aus einer Zeichenfolge mit Kommas als Trennzeichen
Der folgende Code zeigt, wie man eine CSV-Datei aus einer Zeichenfolge (mit Kommas als Trennzeichen) in einen Pandas-DataFrame einliest:
import pandas as pd import io some_string="""team,points,rebounds A,22,10 B,14.9 C,29.6 D,30.2 E,22.9 F,31.10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" , ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Der resultierende Pandas-DataFrame enthält die Werte aus der CSV-Zeichenfolge.
Beispiel 2: Lesen Sie eine CSV-Datei aus einer Zeichenfolge mit einem Semikolon als Trennzeichen
Der folgende Code zeigt, wie man eine CSV-Datei aus einer Zeichenfolge (mit Semikolons als Trennzeichen) in einen Pandas-DataFrame liest:
import pandas as pd import io some_string="""team;points;rebounds A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" ; ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Der resultierende Pandas-DataFrame enthält die Werte aus der CSV-Zeichenfolge.
Beispiel 3: Lesen Sie eine CSV-Datei aus einer Zeichenfolge ohne Header
Der folgende Code zeigt, wie man eine CSV-Datei aus einem String (ohne Kopfzeile) in einen Pandas-DataFrame einliest:
import pandas as pd import io some_string="""A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Durch die Verwendung des Arguments header=None haben wir Pandas angewiesen, die erste Zeile nicht als Kopfzeile zu verwenden.
Standardmäßig verwendet Pandas einen Bereich numerischer Werte (0, 1, 2) als Spaltennamen für den DataFrame.
Hinweis : Die vollständige Dokumentation der Funktion pandas read_csv() finden Sie hier .
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in Python ausführen:
Pandas: So überspringen Sie Zeilen beim Lesen einer CSV-Datei
Pandas: So fügen Sie Daten zu einer vorhandenen CSV-Datei hinzu
Pandas: So lesen Sie eine CSV-Datei ohne Header
Pandas: Spaltennamen beim Importieren einer CSV-Datei festlegen