Pandas: วิธีอ่านเฉพาะบรรทัดจากไฟล์ csv


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่ออ่านเฉพาะบรรทัดจากไฟล์ CSV ลงใน Pandas DataFrame:

 #specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)

ตัวอย่างนี้จะอ่านแถวที่ตำแหน่งดัชนี 0, 2 และ 3 จากไฟล์ CSV ชื่อ my_data.csv ลงใน Pandas DataFrame

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: อ่านเฉพาะบรรทัดจากไฟล์ CSV ใน Pandas

สมมติว่าเรามีไฟล์ CSV ต่อไปนี้ชื่อ Basketball_data.csv :

หากเราใช้ฟังก์ชัน read_csv() แพนด้าจะนำเข้าไฟล์ CSV แต่ละบรรทัดไปยัง DataFrame โดยอัตโนมัติ:

 import pandas as pd

#import all rows of CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ')

#view DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2

อย่างไรก็ตาม เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อนำเข้าเฉพาะแถวที่ตำแหน่งดัชนี 0, 2 และ 3 จากไฟล์ CSV ไปยัง DataFrame ของแพนด้า:

 import pandas as pd

#specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows)

#view DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6

โปรดทราบว่าเฉพาะแถวที่ตำแหน่งดัชนี 0, 2 และ 3 ของไฟล์ CSV เท่านั้นที่จะถูกนำเข้าไปยัง DataFrame

ไวยากรณ์นี้ใช้อาร์กิวเมนต์ skikrows และฟังก์ชัน lambda เพื่อบอกแพนด้าว่าบรรทัดใด ที่ไม่ควรข้าม เมื่อนำเข้าไฟล์ CSV

ในตัวอย่างนี้ เรากำลังบอกแพนด้าว่าอย่ามองข้ามแถวในตำแหน่งดัชนี 0, 2 และ 3 แต่ให้ละเว้นแถวอื่นๆ ทั้งหมดเมื่อนำเข้าไฟล์ CSV

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas read_csv() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีทำงานทั่วไปอื่นๆ ใน Python:

Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ CSV
Pandas: วิธีเพิ่มข้อมูลลงในไฟล์ CSV ที่มีอยู่
Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ CSV
Pandas: วิธีตั้งชื่อคอลัมน์เมื่อนำเข้าไฟล์ CSV

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *