วิธีสร้าง pandas dataframe จากสตริง


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อสร้าง DataFrame แพนด้าจากสตริง:

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

ไวยากรณ์เฉพาะนี้สร้าง DataFrame แพนด้าโดยใช้ค่าที่มีอยู่ในสตริงที่เรียกว่า string_data

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่างที่ 1: สร้าง DataFrame จากสตริงที่มีตัวคั่นด้วยเครื่องหมายจุลภาค

รหัสต่อไปนี้แสดงวิธีการสร้าง DataFrame แพนด้าจากสตริงที่คั่นค่าสตริงด้วยเครื่องหมายจุลภาค:

 import pandas as pd
import io

#define string
string_data="""points, assists, rebounds
5, 15, 22
7, 12, 9
4, 3, 18
2, 5, 10
3, 11, 5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

ผลลัพธ์ที่ได้คือ DataFrame แพนด้าที่มีห้าแถวและสามคอลัมน์

ตัวอย่างที่ 2: สร้าง DataFrame จากสตริงที่มีตัวคั่นอัฒภาค

รหัสต่อไปนี้แสดงวิธีการสร้าง DataFrame แพนด้าจากสตริงที่คั่นค่าสตริงด้วยเครื่องหมายอัฒภาค:

 import pandas as pd
import io

#define string
string_data="""points;assists;rebounds
5;15;22
7;12;9
4;3;18
2;5;10
3;11;5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" ; ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

ผลลัพธ์ที่ได้คือ DataFrame แพนด้าที่มีห้าแถวและสามคอลัมน์

หากคุณมีสตริงที่มีตัวคั่นอื่น เพียงใช้อาร์กิวเมนต์ sep ในฟังก์ชัน read_csv() เพื่อระบุตัวคั่น

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

วิธีแปลงคอลัมน์ Pandas DataFrame เป็นสตริง
วิธีแปลงการประทับเวลาเป็นวันที่/เวลาใน Pandas
วิธีแปลง DateTime เป็นวันที่ใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *