วิธีนับค่าที่หายไปใน pandas dataframe


บ่อยครั้งที่คุณอาจต้องการนับจำนวนค่าที่หายไปใน DataFrame ของแพนด้า

บทช่วยสอนนี้แสดงตัวอย่างวิธีการนับค่าที่หายไปโดยใช้ DataFrame ต่อไปนี้:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

นับรวมค่าที่หายไปใน DataFrame ทั้งหมด

รหัสต่อไปนี้แสดงวิธีคำนวณจำนวนค่าที่หายไปทั้งหมดใน DataFrame ทั้งหมด:

 df. isnull (). sum (). sum ()

5

นี่บอกเราว่ามีค่าที่หายไปทั้งหมด 5 ค่า

นับค่าที่หายไปทั้งหมดต่อคอลัมน์

รหัสต่อไปนี้แสดงวิธีคำนวณจำนวนรวมของค่าที่หายไปในแต่ละคอลัมน์ของ DataFrame:

 df. isnull (). sum ()

at 2
b 2
c 1

สิ่งนี้บอกเรา:

  • คอลัมน์ “a” มีค่าที่ขาดหายไป 2 ค่า
  • คอลัมน์ “b” มีค่าที่ขาดหายไป 2 ค่า
  • คอลัมน์ “c” มีค่าที่ขาดหายไป 1 ค่า

คุณยังสามารถแสดงจำนวนค่าที่หายไปเป็นเปอร์เซ็นต์ของทั้งคอลัมน์ได้:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

สิ่งนี้บอกเรา:

  • 33.33% ของค่าในคอลัมน์ “a” หายไป
  • 33.33% ของค่าในคอลัมน์ “b” หายไป
  • 16.67% ของค่าในคอลัมน์ “c” หายไป

นับค่าที่หายไปทั้งหมดต่อแถว

รหัสต่อไปนี้แสดงวิธีคำนวณจำนวนรวมของค่าที่หายไปในแต่ละแถวของ DataFrame:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

สิ่งนี้บอกเรา:

  • บรรทัดที่ 1 มีค่าที่หายไป 1 ค่า
  • บรรทัดที่ 2 มีค่าที่หายไป 1 ค่า
  • บรรทัดที่ 3 มีค่าที่หายไป 1 ค่า
  • บรรทัดที่ 4 มีค่าที่หายไป 0 ค่า
  • บรรทัดที่ 5 มีค่าที่หายไป 0 ค่า
  • บรรทัดที่ 6 มีค่าที่หายไป 2 ค่า

แหล่งข้อมูลเพิ่มเติม

วิธีค้นหาค่าที่ไม่ซ้ำในหลายคอลัมน์ใน Pandas
วิธีสร้างคอลัมน์ใหม่ตามเงื่อนไขใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *