Pandas: ตั้งชื่อคอลัมน์เมื่อนำเข้าไฟล์ csv
คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อกำหนดชื่อคอลัมน์ของ DataFrame เมื่อนำเข้าไฟล์ CSV ลงในแพนด้า:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
อาร์กิวเมนต์ ชื่อ ใช้รายการชื่อที่คุณต้องการใช้สำหรับคอลัมน์ใน DataFrame
เมื่อใช้อาร์กิวเมนต์นี้ คุณจะบอกให้แพนด้าใช้บรรทัดแรกของไฟล์ CSV เป็นบรรทัดแรกของ DataFrame แทนที่จะใช้เป็นบรรทัดส่วนหัว
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: ตั้งชื่อคอลัมน์เมื่อนำเข้าไฟล์ CSV ไปยัง Pandas
สมมติว่าเรามีไฟล์ CSV ต่อไปนี้ชื่อ Players_data.csv :
จากไฟล์เราจะเห็นว่าแถวแรกไม่มีชื่อคอลัมน์ใดๆ
หากเรานำเข้าไฟล์ CSV โดยใช้ฟังก์ชัน read_csv() แพนด้าจะพยายามใช้ค่าในแถวแรกเป็นชื่อคอลัมน์สำหรับ DataFrame:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
อย่างไรก็ตาม เราสามารถใช้อาร์กิวเมนต์ ชื่อ เพื่อระบุชื่อคอลัมน์ของเราเองเมื่อนำเข้าไฟล์ CSV:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
โปรดทราบว่าบรรทัดแรกของไฟล์ CSV จะไม่ใช้เป็นบรรทัดส่วนหัวอีกต่อไป
ตอนนี้ชื่อคอลัมน์ที่เราระบุโดยใช้อาร์กิวเมนต์ ชื่อ จะถูกนำมาใช้เป็นชื่อคอลัมน์แทน
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas read_csv() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีทำงานทั่วไปอื่นๆ ใน Python:
Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ CSV
Pandas: วิธีเพิ่มข้อมูลลงในไฟล์ CSV ที่มีอยู่
Pandas: วิธีใช้ read_csv พร้อมอาร์กิวเมนต์ usecols