วิธีสร้าง pandas dataframe จากสตริง
คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อสร้าง DataFrame แพนด้าจากสตริง:
import pandas as pd import io df = pd. read_csv ( io.StringIO (string_data), sep=" , ")
ไวยากรณ์เฉพาะนี้สร้าง DataFrame แพนด้าโดยใช้ค่าที่มีอยู่ในสตริงที่เรียกว่า string_data
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่างที่ 1: สร้าง DataFrame จากสตริงที่มีตัวคั่นด้วยเครื่องหมายจุลภาค
รหัสต่อไปนี้แสดงวิธีการสร้าง DataFrame แพนด้าจากสตริงที่คั่นค่าสตริงด้วยเครื่องหมายจุลภาค:
import pandas as pd import io #define string string_data="""points, assists, rebounds 5, 15, 22 7, 12, 9 4, 3, 18 2, 5, 10 3, 11, 5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" , ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
ผลลัพธ์ที่ได้คือ DataFrame แพนด้าที่มีห้าแถวและสามคอลัมน์
ตัวอย่างที่ 2: สร้าง DataFrame จากสตริงที่มีตัวคั่นอัฒภาค
รหัสต่อไปนี้แสดงวิธีการสร้าง DataFrame แพนด้าจากสตริงที่คั่นค่าสตริงด้วยเครื่องหมายอัฒภาค:
import pandas as pd import io #define string string_data="""points;assists;rebounds 5;15;22 7;12;9 4;3;18 2;5;10 3;11;5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" ; ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
ผลลัพธ์ที่ได้คือ DataFrame แพนด้าที่มีห้าแถวและสามคอลัมน์
หากคุณมีสตริงที่มีตัวคั่นอื่น เพียงใช้อาร์กิวเมนต์ sep ในฟังก์ชัน read_csv() เพื่อระบุตัวคั่น
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:
วิธีแปลงคอลัมน์ Pandas DataFrame เป็นสตริง
วิธีแปลงการประทับเวลาเป็นวันที่/เวลาใน Pandas
วิธีแปลง DateTime เป็นวันที่ใน Pandas