Pandas: วิธีปรับรูปร่าง dataframe จากกว้างไปเป็นยาว
คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อแปลง DataFrame ของ pandas จากรูปแบบกว้างเป็นรูปแบบยาว:
df = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])
ในสถานการณ์นี้ col1 คือคอลัมน์ที่เราใช้เป็นตัวระบุและ col2 , col3 ฯลฯ คือคอลัมน์ที่เราเลิกทำเดือย
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: ปรับรูปร่าง Pandas DataFrame จากกว้างไปเป็นยาว
สมมติว่าเรามี DataFrame แพนด้าดังต่อไปนี้:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'], ' points ': [88, 91, 99, 94], ' assists ': [12, 17, 24, 28], ' rebounds ': [22, 28, 30, 31]}) #view DataFrame df team points assists rebounds 0 A 88 12 22 1 B 91 17 28 2 C 99 24 30 3 D 94 28 31
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อปรับรูปร่าง DataFrame นี้จากรูปแบบกว้างเป็นรูปแบบยาว:
#reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])
#view updated DataFrame
df
team variable value
0 A points 88
1 B points 91
2 C dots 9 9
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31
ขณะนี้ DataFrame อยู่ในรูปแบบยาว
เราใช้คอลัมน์ “ทีม” เป็นคอลัมน์ระบุตัวตน และยกเลิกการหมุนคอลัมน์ “คะแนน” “แอสซิสต์” และ “รีบาวด์”
โปรดทราบว่าเรายังสามารถใช้อาร์กิวเมนต์ var_name และ value_name เพื่อระบุชื่อคอลัมน์ใน DataFrame แบบยาวใหม่:
#reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
var_name=' metric ', value_name=' amount ')
#view updated DataFrame
df
team metric amount
0 A points 88
1 B points 91
2 C points 99
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas Melt() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่นๆ ใน Python:
วิธีเพิ่มแถวใน Pandas DataFrame
วิธีเพิ่มคอลัมน์ใน Pandas DataFrame
วิธีนับการเกิดขึ้นของค่าเฉพาะใน Pandas DataFrame