كيفية حساب القيم المفقودة في pandas dataframe


في كثير من الأحيان قد ترغب في حساب عدد القيم المفقودة في Pandas DataFrame.

يوضح هذا البرنامج التعليمي عدة أمثلة لكيفية حساب القيم المفقودة باستخدام DataFrame التالي:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

احسب إجمالي القيم المفقودة في DataFrame بأكمله

يوضح الكود التالي كيفية حساب العدد الإجمالي للقيم المفقودة في DataFrame بأكمله:

 df. isnull (). sum (). sum ()

5

يخبرنا هذا أن هناك 5 قيم مفقودة إجمالاً.

حساب إجمالي القيم المفقودة لكل عمود

يوضح الكود التالي كيفية حساب العدد الإجمالي للقيم المفقودة في كل عمود من DataFrame:

 df. isnull (). sum ()

at 2
b 2
c 1

هذا يخبرنا:

  • يحتوي العمود “أ” على قيمتين مفقودتين .
  • يحتوي العمود “ب” على قيمتين مفقودتين .
  • يحتوي العمود “c” على قيمة واحدة مفقودة.

يمكنك أيضًا عرض عدد القيم المفقودة كنسبة مئوية من العمود بأكمله:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

هذا يخبرنا:

  • 33.33% من القيم في العمود “أ” مفقودة.
  • 33.33% من القيم في العمود “ب” مفقودة.
  • 16.67% من القيم في العمود “ج” مفقودة.

حساب إجمالي القيم المفقودة لكل صف

يوضح الكود التالي كيفية حساب العدد الإجمالي للقيم المفقودة في كل صف من DataFrame:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

هذا يخبرنا:

  • يحتوي السطر 1 على قيمة واحدة مفقودة.
  • يحتوي السطر 2 على قيمة واحدة مفقودة.
  • يحتوي السطر 3 على قيمة واحدة مفقودة.
  • يحتوي السطر 4 على 0 قيم مفقودة.
  • يحتوي السطر 5 على 0 قيم مفقودة.
  • يحتوي السطر 6 على قيمتين مفقودتين .

مصادر إضافية

كيفية العثور على قيم فريدة في أعمدة متعددة في Pandas
كيفية إنشاء عمود جديد بناءً على شرط في Pandas

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *