كيفية حساب القيم المفقودة في pandas dataframe
في كثير من الأحيان قد ترغب في حساب عدد القيم المفقودة في Pandas DataFrame.
يوضح هذا البرنامج التعليمي عدة أمثلة لكيفية حساب القيم المفقودة باستخدام DataFrame التالي:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
احسب إجمالي القيم المفقودة في DataFrame بأكمله
يوضح الكود التالي كيفية حساب العدد الإجمالي للقيم المفقودة في DataFrame بأكمله:
df. isnull (). sum (). sum () 5
يخبرنا هذا أن هناك 5 قيم مفقودة إجمالاً.
حساب إجمالي القيم المفقودة لكل عمود
يوضح الكود التالي كيفية حساب العدد الإجمالي للقيم المفقودة في كل عمود من DataFrame:
df. isnull (). sum () at 2 b 2 c 1
هذا يخبرنا:
- يحتوي العمود “أ” على قيمتين مفقودتين .
- يحتوي العمود “ب” على قيمتين مفقودتين .
- يحتوي العمود “c” على قيمة واحدة مفقودة.
يمكنك أيضًا عرض عدد القيم المفقودة كنسبة مئوية من العمود بأكمله:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
هذا يخبرنا:
- 33.33% من القيم في العمود “أ” مفقودة.
- 33.33% من القيم في العمود “ب” مفقودة.
- 16.67% من القيم في العمود “ج” مفقودة.
حساب إجمالي القيم المفقودة لكل صف
يوضح الكود التالي كيفية حساب العدد الإجمالي للقيم المفقودة في كل صف من DataFrame:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
هذا يخبرنا:
- يحتوي السطر 1 على قيمة واحدة مفقودة.
- يحتوي السطر 2 على قيمة واحدة مفقودة.
- يحتوي السطر 3 على قيمة واحدة مفقودة.
- يحتوي السطر 4 على 0 قيم مفقودة.
- يحتوي السطر 5 على 0 قيم مفقودة.
- يحتوي السطر 6 على قيمتين مفقودتين .
مصادر إضافية
كيفية العثور على قيم فريدة في أعمدة متعددة في Pandas
كيفية إنشاء عمود جديد بناءً على شرط في Pandas