Pandas: วิธีเติมค่า nan โดยใช้พจนานุกรม


คุณสามารถใช้ฟังก์ชัน fillna() กับพจนานุกรมเพื่อแทนที่ค่า NaN ในคอลัมน์หนึ่งของ DataFrame ของ pandas โดยยึดตามค่าในคอลัมน์อื่น

เมื่อต้องการทำเช่นนี้ คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 #define dictionary
dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 }

#replace values in col2 based on dictionary values in col1
df[' col2 '] = df[' col2 ']. fillna (df[' col1 ']. map (dict))

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: กรอกค่า NaN ใน Pandas โดยใช้พจนานุกรม

สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับยอดขายในร้านค้าปลีกต่างๆ:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'],
                   ' sales ': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]})

#view DataFrame
print (df)

  blind sales
0 to 12.0
1 A NaN
2 B 30.0
3 C NaN
4 D 24.0
5CNaN
6BNaN
7 D 13.0

โปรดทราบว่ามีค่า NaN หลายค่าในคอลัมน์ การขาย

สมมติว่าเราต้องการเติม NaN เหล่านี้ในคอลัมน์ การขาย โดยใช้ค่าที่สอดคล้องกับค่าเฉพาะในคอลัมน์ ร้านค้า

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อทำสิ่งนี้:

 #define dictionary
dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 }

#replace values in sales column based on dictionary values in store column
df[' sales '] = df[' sales ']. fillna (df[' store ']. map (dict))

#view updated DataFrame
print (df)

  blind sales
0 to 12.0
1 A 5.0
2 B 30.0
3C 15.0
4 D 24.0
5C 15.0
6 B 10.0
7 D 13.0

เราใช้พจนานุกรมเพื่อแทนที่รายการต่อไปนี้ในคอลัมน์การขาย:

  • หากร้านค้าคือ A ให้แทนที่ NaN ใน Sales ด้วยค่า 5
  • หากร้านค้าคือ B ให้แทนที่ NaN ในยอดขายด้วยค่า 10
  • หากร้านค้าคือ C ให้แทนที่ NaN ในยอดขายด้วยค่า 15
  • หากร้านค้าคือ D ให้แทนที่ NaN ในยอดขายด้วยค่า 20

คุณสามารถดูเอกสารออนไลน์ฉบับเต็มสำหรับฟังก์ชัน fillna() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ในแพนด้า:

วิธีนับค่าที่หายไปในแพนด้า
วิธีลบแถวที่มีค่า NaN ใน Pandas
วิธีลบแถวที่มีค่าเฉพาะใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *