วิธียกเลิกการหมุน pandas dataframe (พร้อมตัวอย่าง)


ในแพนด้า คุณสามารถใช้ฟังก์ชัน Melt() เพื่อยกเลิกการหมุน DataFrame โดยแปลงจากรูปแบบกว้างเป็น รูปแบบยาว

ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 df_unpivot = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])

ทอง:

  • id_vars : คอลัมน์ที่จะใช้เป็นตัวระบุ
  • value_vars : คอลัมน์ที่จะยกเลิกการหมุน

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: การยกเลิกการหมุน Pandas DataFrame

สมมติว่าเรามี DataFrame แพนด้าดังต่อไปนี้:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                   ' points ': [18, 22, 19, 14, 14],
                   ' assists ': [5, 7, 7, 9, 12],
                   ' rebounds ': [11, 8, 10, 6, 6]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อ “unpivot” DataFrame:

 #unpivot DataFrame from wide format to long format
df_unpivot = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])

#view updated DataFrame
print (df_unpivot)

   team variable value
0 A points 18
1 B points 22
2 C points 19
3 D dots 14
4 E points 14
5 A assists 5
6 B assists 7
7 C assists 7
8 D assists 9
9 E assists 12
10 A rebounds 11
11 B rebounds 8
12 C rebounds 10
13 D rebounds 6
14 E rebounds 6

เราใช้คอลัมน์ ทีม เป็นคอลัมน์ตัวระบุ และเลือกที่จะไม่หมุนเวียน คอลัมน์ คะแนน แอสซิสต์ และ รีบาวด์

ผลลัพธ์ที่ได้คือ DataFrame รูปแบบยาว

โปรดทราบว่าเรายังสามารถใช้อาร์กิวเมนต์ var_name และ value_name เพื่อระบุชื่อคอลัมน์ใน DataFrame ที่ไม่ได้หมุนได้:

 #unpivot DataFrame from wide format to long format
df_unpivot = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
             var_name=' metric ', value_name=' amount ')

#view updated DataFrame
print (df_unpivot)

   team metric amount
0 A points 18
1 B points 22
2 C points 19
3 D dots 14
4 E points 14
5 A assists 5
6 B assists 7
7 C assists 7
8 D assists 9
9 E assists 12
10 A rebounds 11
11 B rebounds 8
12 C rebounds 10
13 D rebounds 6
14 E rebounds 6

โปรดทราบว่าขณะนี้คอลัมน์ใหม่มีชื่อว่า Metric and Amount

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่นๆ ใน Python:

วิธีเพิ่มแถวใน Pandas DataFrame
วิธีเพิ่มคอลัมน์ใน Pandas DataFrame
วิธีนับการเกิดขึ้นของค่าเฉพาะใน Pandas DataFrame

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *