วิธีอ่านไฟล์ tsv ด้วย pandas (รวมถึงตัวอย่าง)
หากต้องการอ่านไฟล์ TSV ที่มีแพนด้าใน Python คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้:
df = pd. read_csv (" data.txt ", sep=" \t ")
บทช่วยสอนนี้มีตัวอย่างการใช้งานฟังก์ชันนี้ในทางปฏิบัติหลายตัวอย่าง
อ่านไฟล์ TSV ที่มีส่วนหัว
สมมติว่าเรามีไฟล์ TSV ต่อไปนี้ชื่อ data.txt โดยมีส่วนหัว:
หากต้องการอ่านไฟล์นี้ลงใน DataFrame ของ pandas เราสามารถใช้ไวยากรณ์ต่อไปนี้:
import pandas as pd #read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ") #view DataFrame print (df) column1 column2 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
เราสามารถพิมพ์คลาส DataFrame และค้นหาจำนวนแถวและคอลัมน์โดยใช้ไวยากรณ์ต่อไปนี้:
#display class of DataFrame print (type(df)) <class 'pandas.core.frame.DataFrame'> #display number of rows and columns in DataFrame df. shape (10, 2)
เราจะเห็นว่า df เป็น DataFrame ของ pandas ที่มี 10 แถว 2 คอลัมน์
อ่านไฟล์ TSV โดยไม่มีส่วนหัว
สมมติว่าเรามีไฟล์ TSV ต่อไปนี้ชื่อ data.txt โดยไม่มีส่วนหัว:
หากต้องการอ่านไฟล์นี้ลงใน DataFrame ของ pandas เราสามารถใช้ไวยากรณ์ต่อไปนี้:
#read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ", header= None ) #view DataFrame print (df) 0 1 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
เนื่องจากไฟล์ข้อความไม่มีส่วนหัว แพนด้าเพียงแค่ตั้งชื่อคอลัมน์ 0 และ 1
อ่านไฟล์ TSV โดยไม่มีส่วนหัวและระบุชื่อคอลัมน์
หากเราต้องการ เราสามารถกำหนดชื่อคอลัมน์เมื่อนำเข้าไฟล์ข้อความโดยใช้อาร์กิวเมนต์ ชื่อ :
#read TSV file into pandas DataFrame and specify column names df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] ) #display DataFrame print (df) A B 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการอ่านไฟล์ประเภทอื่นด้วยแพนด้า:
วิธีอ่านไฟล์ข้อความด้วย Pandas
วิธีอ่านไฟล์ CSV ด้วย Pandas
วิธีอ่านไฟล์ Excel ด้วย Pandas
วิธีอ่านไฟล์ JSON ด้วย Pandas