วิธีนับค่าที่หายไปใน pandas dataframe
บ่อยครั้งที่คุณอาจต้องการนับจำนวนค่าที่หายไปใน DataFrame ของแพนด้า
บทช่วยสอนนี้แสดงตัวอย่างวิธีการนับค่าที่หายไปโดยใช้ DataFrame ต่อไปนี้:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
นับรวมค่าที่หายไปใน DataFrame ทั้งหมด
รหัสต่อไปนี้แสดงวิธีคำนวณจำนวนค่าที่หายไปทั้งหมดใน DataFrame ทั้งหมด:
df. isnull (). sum (). sum () 5
นี่บอกเราว่ามีค่าที่หายไปทั้งหมด 5 ค่า
นับค่าที่หายไปทั้งหมดต่อคอลัมน์
รหัสต่อไปนี้แสดงวิธีคำนวณจำนวนรวมของค่าที่หายไปในแต่ละคอลัมน์ของ DataFrame:
df. isnull (). sum () at 2 b 2 c 1
สิ่งนี้บอกเรา:
- คอลัมน์ “a” มีค่าที่ขาดหายไป 2 ค่า
- คอลัมน์ “b” มีค่าที่ขาดหายไป 2 ค่า
- คอลัมน์ “c” มีค่าที่ขาดหายไป 1 ค่า
คุณยังสามารถแสดงจำนวนค่าที่หายไปเป็นเปอร์เซ็นต์ของทั้งคอลัมน์ได้:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
สิ่งนี้บอกเรา:
- 33.33% ของค่าในคอลัมน์ “a” หายไป
- 33.33% ของค่าในคอลัมน์ “b” หายไป
- 16.67% ของค่าในคอลัมน์ “c” หายไป
นับค่าที่หายไปทั้งหมดต่อแถว
รหัสต่อไปนี้แสดงวิธีคำนวณจำนวนรวมของค่าที่หายไปในแต่ละแถวของ DataFrame:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
สิ่งนี้บอกเรา:
- บรรทัดที่ 1 มีค่าที่หายไป 1 ค่า
- บรรทัดที่ 2 มีค่าที่หายไป 1 ค่า
- บรรทัดที่ 3 มีค่าที่หายไป 1 ค่า
- บรรทัดที่ 4 มีค่าที่หายไป 0 ค่า
- บรรทัดที่ 5 มีค่าที่หายไป 0 ค่า
- บรรทัดที่ 6 มีค่าที่หายไป 2 ค่า
แหล่งข้อมูลเพิ่มเติม
วิธีค้นหาค่าที่ไม่ซ้ำในหลายคอลัมน์ใน Pandas
วิธีสร้างคอลัมน์ใหม่ตามเงื่อนไขใน Pandas