Pandas: วิธีแทนที่ค่า nan ในตารางเดือยด้วยศูนย์
คุณสามารถใช้อาร์กิวเมนต์ fill_value ใน pandas เพื่อแทนที่ค่า NaN ในตาราง Pivot ด้วยศูนย์
เมื่อต้องการทำเช่นนี้ คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้:
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: แทนที่ค่า NaN ในตารางสาระสำคัญด้วยศูนย์
สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B F 9 5 B F 5 6 B F 5 7 B F 12
เราสามารถใช้โค้ดต่อไปนี้เพื่อสร้างตารางสาระสำคัญในแพนด้าที่แสดงค่า คะแนน เฉลี่ยสำหรับแต่ละ ทีม และ ตำแหน่ง ใน DataFrame:
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')
#view pivot table
print (df_pivot)
CFG position
team
A 8.0 6.00 4.0
B NaN 7.75 NaN
โปรดทราบว่ามีค่า NaN สองค่าในตาราง Pivot เนื่องจากไม่มีผู้เล่นคนใดมีตำแหน่ง C หรือ G ในทีม B ใน DataFrame ดั้งเดิม ดังนั้นทั้งสองตำแหน่งนี้จึงมีค่า NaN ในตาราง Pivot
ในการเติมค่า NaN เหล่านี้ด้วยศูนย์ในตารางเดือย เราสามารถใช้อาร์กิวเมนต์ fill_value :
#create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
fill_value= 0 )
#view pivot table
print (df_pivot)
CFG position
team
A 8 6.00 4
B 0 7.75 0
โปรดทราบว่าค่า NaN แต่ละค่าในตารางเดือยก่อนหน้านั้นถูกเติมด้วยศูนย์
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas pivot_table() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ในแพนด้า:
Pandas: วิธีปรับรูปร่าง DataFrame จากยาวไปเป็นกว้าง
Pandas: วิธีปรับรูปร่าง DataFrame จากกว้างไปเป็นยาว
นุ่น: วิธีจัดกลุ่มและรวมเป็นหลายคอลัมน์