كيفية البحث عن القيم المفقودة وإحصائها في لغة r (مع أمثلة)


يمكنك استخدام الطرق التالية للعثور على القيم المفقودة في R وحسابها:

الطريقة الأولى: البحث عن موقع القيم المفقودة

 which( is.na (df$column_name))

الطريقة الثانية: حساب إجمالي القيم المفقودة

 sum( is.na (df$column_name))

توضح الأمثلة التالية كيفية استخدام هذه الوظائف عمليًا.

مثال 1: البحث عن القيم المفقودة في عمود وإحصائها

لنفترض أن لدينا إطار البيانات التالي:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

يمكننا استخدام الكود التالي لتحديد المواضع التي بها قيم مفقودة في عمود “المساعدة” وإيجاد إجمالي القيم المفقودة في عمود “المساعدة”:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

من النتيجة يمكننا أن نرى أن المواضع 1 و 3 و 4 بها قيم مفقودة في عمود “المساعدات” ويوجد إجمالي 3 قيم مفقودة في العمود.

مثال 2: حساب القيم المفقودة في جميع الأعمدة

يوضح الكود التالي كيفية حساب إجمالي القيم المفقودة في كل عمود من إطار البيانات:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

ومن النتيجة يمكننا أن نرى:

  • يحتوي عمود “الفريق” على قيمة واحدة مفقودة.
  • يحتوي عمود “النقاط” على 0 قيم مفقودة.
  • يحتوي عمود “المساعدة” على 3 قيم مفقودة.
  • يحتوي عمود “الارتدادات” على قيمة واحدة مفقودة.

مثال 3: حساب القيم المفقودة في إطار البيانات بأكمله

يوضح الكود التالي كيفية حساب إجمالي القيم المفقودة في إطار بيانات كامل:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

من النتيجة يمكننا أن نرى أن هناك 5 قيم مفقودة إجمالاً في إطار البيانات بأكمله.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ عمليات شائعة أخرى ذات قيم مفقودة في R:

كيفية احتساب جميع القيم المفقودة في R
كيفية استبدال NAs بسلاسل في R
كيفية استبدال NA بصفر في dplyr

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *