Een tsv-bestand lezen met panda's (inclusief voorbeelden)
Om een TSV-bestand met panda’s in Python te lezen, kun je de volgende basissyntaxis gebruiken:
df = pd. read_csv (" data.txt ", sep=" \t ")
Deze tutorial biedt verschillende voorbeelden van praktisch gebruik van deze functie.
Lees een TSV-bestand met een header
Stel dat we het volgende TSV-bestand hebben met de naam data.txt met een header:
Om dit bestand in een Panda DataFrame te lezen, kunnen we de volgende syntaxis gebruiken:
import pandas as pd #read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ") #view DataFrame print (df) column1 column2 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
We kunnen de klasse DataFrame afdrukken en het aantal rijen en kolommen vinden met behulp van de volgende syntaxis:
#display class of DataFrame print (type(df)) <class 'pandas.core.frame.DataFrame'> #display number of rows and columns in DataFrame df. shape (10, 2)
We kunnen zien dat df een panda’s DataFrame is met 10 rijen en 2 kolommen.
Lees een TSV-bestand zonder header
Laten we zeggen dat we het volgende TSV-bestand hebben met de naam data.txt zonder header:
Om dit bestand in een Panda DataFrame te lezen, kunnen we de volgende syntaxis gebruiken:
#read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ", header= None ) #view DataFrame print (df) 0 1 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
Omdat het tekstbestand geen koptekst had, noemden panda’s eenvoudigweg de kolommen 0 en 1 .
Lees het TSV-bestand zonder header en geef kolomnamen op
Als we willen, kunnen we kolomnamen toewijzen bij het importeren van het tekstbestand met behulp van het argument namen :
#read TSV file into pandas DataFrame and specify column names df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] ) #display DataFrame print (df) A B 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere bestandstypen met panda’s kunt lezen:
Hoe een tekstbestand te lezen met Panda’s
Hoe CSV-bestanden te lezen met Panda’s
Excel-bestanden lezen met Panda’s
Hoe een JSON-bestand te lezen met Pandas