Pandas: วิธีเพิ่มผลรวมย่อยลงในตารางสรุป
บ่อยครั้งคุณอาจต้องการเพิ่มผลรวมย่อยลงในตารางเดือยแพนด้า
โชคดีที่ทำได้ง่ายโดยใช้ฟังก์ชันในตัวของแพนด้า
ตัวอย่างต่อไปนี้แสดงวิธีการทำเช่นนี้
ตัวอย่าง: เพิ่มผลรวมย่อยลงใน Pandas PivotTable
สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'], ' all_star ': ['Y', 'N', 'Y', 'Y', 'N', 'N', 'N', 'Y'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position all_star points 0 AGY 4 1 AGN 4 2 AFY 6 3 AFY 8 4 BGN 9 5 BFN 5 6 BFN 5 7 BFY 12
เราสามารถใช้โค้ดต่อไปนี้เพื่อสร้างตารางสาระสำคัญในแพนด้าที่แสดงผลรวมของ คะแนน สำหรับการรวมกันของ team , all_star และ ตำแหน่ง ใน DataFrame:
#create pivot table
my_table = pd. pivot_table (df, values=' points ',
index=[' team ', ' all_star '],
columns=' position ',
aggfunc=' sum ')
#view pivot table
print (my_table)
FG position
team all_star
AN NaN 4.0
Y 14.0 4.0
BN 10.0 9.0
Y 12.0 NaN
ตอนนี้ สมมติว่าเราต้องการเพิ่มแถว ผลรวมย่อย ที่แสดงคะแนนรวมย่อยสำหรับแต่ละทีมและตำแหน่ง
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อทำสิ่งนี้:
#add subtotals row to pivot table
p.d. concat ([
y. append ( y.sum (). rename ((x, ' Total ')))
for x, y in my_table. groupby (level= 0 )
]). append ( my_table.sum (). rename ((' Large ', ' Total ')))
position F G
team all_star
A N NaN 4.0
Y 7.0 4.0
Overall 7.0 8.0
B N 5.0 9.0
Y 12.0 NaN
Total 17.0 9.0
Grand Total 24.0 17.0
ตอนนี้เรามีแถวผลรวมย่อยสองแถวที่แสดงผลรวมย่อยสำหรับแต่ละทีมและตำแหน่ง รวมถึงแถวผลรวมทั้งหมดที่แสดงผลรวมทั้งหมดสำหรับแต่ละคอลัมน์
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas pivot_table() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ในแพนด้า:
นุ่น: วิธีสร้างตารางเดือยด้วยจำนวนค่า
Pandas: วิธีแทนที่ค่า NaN ในตารางเดือยด้วยศูนย์
นุ่น: วิธีแปลง PivotTable เป็น DataFrame