ج: كيفية العثور على الأعمدة التي تحتوي على كافة القيم المفقودة
يمكنك استخدام الطرق التالية للعثور على الأعمدة في إطار البيانات في R التي تحتوي على كافة القيم المفقودة:
الطريقة الأولى: استخدم Base R
#check if each column has all missing values all_miss <- apply(df, 2, function (x) all(is. na (x))) #display columns with all missing values names(all_miss[all_miss>0])
الطريقة الثانية: استخدم حزمة Purrr
library (purrr) #display columns with all missing values df %>% keep(~all(is. na (.x))) %>% names
تنتج كلتا الطريقتين نفس النتيجة، لكن أسلوب الخرخرة يميل إلى أن يكون أسرع بالنسبة لإطارات البيانات الكبيرة للغاية.
توضح الأمثلة التالية كيفية استخدام كل طريقة مع إطار البيانات التالي في R:
#create data frame
df <- data. frame (points=c(21, 15, 10, 4, 4, 9, 12, 10),
assists=c(NA, NA, NA, NA, NA, NA, NA, NA),
rebounds=c(8, 12, 14, 10, 7, 9, 8, 5),
steals=c(NA, NA, NA, NA, NA, NA, NA, NA))
#view data frame
df
points assists rebounds steals
1 21 NA 8 NA
2 15 NA 12 NA
3 10 NA 14 NA
4 4 NA 10 NA
5 4 NA 7 NA
6 9 NA 9 NA
7 12 NA 8 NA
8 10 NA 5 NA
مثال 1: ابحث عن الأعمدة التي تحتوي على جميع القيم المفقودة باستخدام Base R
يوضح التعليمة البرمجية التالية كيفية البحث عن الأعمدة في إطار البيانات مع كافة القيم المفقودة:
#check if each column has all missing values all_miss <- apply(df, 2, function (x) all(is. na (x))) #display columns with all missing values names(all_miss[all_miss>0]) [1] “assists” “steals”
من النتيجة، يمكننا أن نرى أن الأعمدة المساعدة والاعتراضية جميعها تحتوي على قيم مفقودة.
مثال 2: ابحث عن الأعمدة التي تحتوي على جميع القيم المفقودة باستخدام الحزمة Purrr
يوضح الكود التالي كيفية العثور على الأعمدة في إطار البيانات مع جميع القيم المفقودة باستخدام وظائف من حزمة Purrr :
library (purrr) #display columns with all missing values df %>% keep(~all(is. na (.x))) %>% names [1] “assists” “steals”
من النتيجة، يمكننا أن نرى أن الأعمدة المساعدة والاعتراضية جميعها تحتوي على قيم مفقودة.
وهذا يتوافق مع إخراج طريقة R الأساسية.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ عمليات شائعة أخرى ذات قيم مفقودة في R:
كيفية احتساب جميع القيم المفقودة في R
كيفية استبدال NAs بسلاسل في R
كيفية استبدال NA بصفر في dplyr