Een tekstbestand lezen met panda's (inclusief voorbeelden)
Om een tekstbestand met panda’s in Python te lezen, kun je de volgende basissyntaxis gebruiken:
df = pd. read_csv (" data.txt ", sep="")
Deze tutorial biedt verschillende voorbeelden van praktisch gebruik van deze functie.
Lees een tekstbestand met een header
Stel dat we het volgende tekstbestand hebben met de naam data.txt met een header:
Om dit bestand in een Panda DataFrame te lezen, kunnen we de volgende syntaxis gebruiken:
import pandas as pd #read text file into pandas DataFrame df = pd. read_csv (" data.txt ", sep="") #display DataFrame print (df) column1 column2 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 4 4 7 5 2 8 4 8 9 6 8
We kunnen de klasse DataFrame afdrukken en het aantal rijen en kolommen vinden met behulp van de volgende syntaxis:
#display class of DataFrame print (type(df)) <class 'pandas.core.frame.DataFrame'> #display number of rows and columns in DataFrame df. shape (10, 2)
We kunnen zien dat df een panda’s DataFrame is met 10 rijen en 2 kolommen.
Lees een tekstbestand zonder header
Stel dat we het volgende tekstbestand hebben met de naam data.txt zonder header:
Om dit bestand in een Panda DataFrame te lezen, kunnen we de volgende syntaxis gebruiken:
#read text file into pandas DataFrame df = pd. read_csv (" data.txt ", sep="", header= None ) #display DataFrame print (df) 0 1 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 4 4 7 5 2 8 4 8 9 6 8
Omdat het tekstbestand geen koptekst had, noemden panda’s eenvoudigweg de kolommen 0 en 1 .
Lees een tekstbestand zonder kopteksten en geef kolomnamen op
Als we willen, kunnen we kolomnamen toewijzen bij het importeren van het tekstbestand met behulp van het argument namen :
#read text file into pandas DataFrame and specify column names df = pd. read_csv (" data.txt ", sep="", header= None, names=[" A ", " B "] ) #display DataFrame print (df) AB 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 4 4 7 5 2 8 4 8 9 6 8
Aanvullende bronnen
Hoe CSV-bestanden te lezen met Panda’s
Excel-bestanden lezen met Panda’s
Hoe een JSON-bestand te lezen met Pandas