วิธีอ่านไฟล์ tsv ด้วย pandas (รวมถึงตัวอย่าง)


หากต้องการอ่านไฟล์ TSV ที่มีแพนด้าใน Python คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 df = pd. read_csv (" data.txt ", sep=" \t ")

บทช่วยสอนนี้มีตัวอย่างการใช้งานฟังก์ชันนี้ในทางปฏิบัติหลายตัวอย่าง

อ่านไฟล์ TSV ที่มีส่วนหัว

สมมติว่าเรามีไฟล์ TSV ต่อไปนี้ชื่อ data.txt โดยมีส่วนหัว:

หากต้องการอ่านไฟล์นี้ลงใน DataFrame ของ pandas เราสามารถใช้ไวยากรณ์ต่อไปนี้:

 import pandas as pd

#read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ")

#view DataFrame
print (df)

	column1 column2
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

เราสามารถพิมพ์คลาส DataFrame และค้นหาจำนวนแถวและคอลัมน์โดยใช้ไวยากรณ์ต่อไปนี้:

 #display class of DataFrame
print (type(df))

<class 'pandas.core.frame.DataFrame'>

#display number of rows and columns in DataFrame
df. shape

(10, 2)

เราจะเห็นว่า df เป็น DataFrame ของ pandas ที่มี 10 แถว 2 คอลัมน์

อ่านไฟล์ TSV โดยไม่มีส่วนหัว

สมมติว่าเรามีไฟล์ TSV ต่อไปนี้ชื่อ data.txt โดยไม่มีส่วนหัว:

หากต้องการอ่านไฟล์นี้ลงใน DataFrame ของ pandas เราสามารถใช้ไวยากรณ์ต่อไปนี้:

 #read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ", header= None )

#view DataFrame
print (df)

        0 1
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

เนื่องจากไฟล์ข้อความไม่มีส่วนหัว แพนด้าเพียงแค่ตั้งชื่อคอลัมน์ 0 และ 1

อ่านไฟล์ TSV โดยไม่มีส่วนหัวและระบุชื่อคอลัมน์

หากเราต้องการ เราสามารถกำหนดชื่อคอลัมน์เมื่อนำเข้าไฟล์ข้อความโดยใช้อาร์กิวเมนต์ ชื่อ :

 #read TSV file into pandas DataFrame and specify column names
df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] )

#display DataFrame
print (df)

	A B
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการอ่านไฟล์ประเภทอื่นด้วยแพนด้า:

วิธีอ่านไฟล์ข้อความด้วย Pandas
วิธีอ่านไฟล์ CSV ด้วย Pandas
วิธีอ่านไฟล์ Excel ด้วย Pandas
วิธีอ่านไฟล์ JSON ด้วย Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *