Een tsv-bestand lezen met panda's (inclusief voorbeelden)


Om een TSV-bestand met panda’s in Python te lezen, kun je de volgende basissyntaxis gebruiken:

 df = pd. read_csv (" data.txt ", sep=" \t ")

Deze tutorial biedt verschillende voorbeelden van praktisch gebruik van deze functie.

Lees een TSV-bestand met een header

Stel dat we het volgende TSV-bestand hebben met de naam data.txt met een header:

Om dit bestand in een Panda DataFrame te lezen, kunnen we de volgende syntaxis gebruiken:

 import pandas as pd

#read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ")

#view DataFrame
print (df)

	column1 column2
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

We kunnen de klasse DataFrame afdrukken en het aantal rijen en kolommen vinden met behulp van de volgende syntaxis:

 #display class of DataFrame
print (type(df))

<class 'pandas.core.frame.DataFrame'>

#display number of rows and columns in DataFrame
df. shape

(10, 2)

We kunnen zien dat df een panda’s DataFrame is met 10 rijen en 2 kolommen.

Lees een TSV-bestand zonder header

Laten we zeggen dat we het volgende TSV-bestand hebben met de naam data.txt zonder header:

Om dit bestand in een Panda DataFrame te lezen, kunnen we de volgende syntaxis gebruiken:

 #read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ", header= None )

#view DataFrame
print (df)

        0 1
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

Omdat het tekstbestand geen koptekst had, noemden panda’s eenvoudigweg de kolommen 0 en 1 .

Lees het TSV-bestand zonder header en geef kolomnamen op

Als we willen, kunnen we kolomnamen toewijzen bij het importeren van het tekstbestand met behulp van het argument namen :

 #read TSV file into pandas DataFrame and specify column names
df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] )

#display DataFrame
print (df)

	A B
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere bestandstypen met panda’s kunt lezen:

Hoe een tekstbestand te lezen met Panda’s
Hoe CSV-bestanden te lezen met Panda’s
Excel-bestanden lezen met Panda’s
Hoe een JSON-bestand te lezen met Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert