كيفية استخدام وظيفة droplevels في لغة r (مع أمثلة)
يمكن استخدام الدالة droplevels() في R لإزالة مستويات العوامل غير المستخدمة.
تعد هذه الوظيفة مفيدة بشكل خاص إذا أردنا إزالة مستويات العوامل التي لم تعد مستخدمة بسبب مجموعة فرعية من ناقل أو إطار بيانات.
تستخدم هذه الوظيفة بناء الجملة التالي:
مستويات الهبوط (x)
حيث x هو كائن يمكن إزالة مستويات العوامل غير المستخدمة منه.
يقدم هذا البرنامج التعليمي بعض الأمثلة حول كيفية استخدام هذه الميزة عمليًا.
مثال 1: إزالة مستويات العوامل غير المستخدمة في المتجه
لنفترض أننا أنشأنا ناقل بيانات بخمسة مستويات للعوامل. بعد ذلك، لنفترض أننا حددنا متجه بيانات جديدًا بثلاثة فقط من مستويات العوامل الخمسة الأصلية.
#define data with 5 factor levels data <- factor (c(1, 2, 3, 4, 5)) #define new data as original data minus 4th and 5th factor levels new_data <- data[-c(4, 5)] #view new data new_data [1] 1 2 3 Levels: 1 2 3 4 5
على الرغم من أن البيانات الجديدة تحتوي على ثلاثة عوامل فقط، يمكننا أن نرى أنها لا تزال تحتوي على مستويات العوامل الخمسة الأصلية.
لإزالة مستويات العوامل غير المستخدمة هذه، يمكننا استخدام الدالة droplevels() :
#drop unused factor levels new_data < -droplevels (new_data) #view data new_data [1] 1 2 3 Levels: 1 2 3
تحتوي البيانات الجديدة الآن على ثلاثة مستويات فقط من العوامل.
مثال 2: إزالة مستويات العوامل غير المستخدمة في إطار البيانات
لنفترض أننا أنشأنا إطار بيانات يكون فيه أحد المتغيرات عاملاً من خمسة مستويات. بعد ذلك، لنفترض أننا حددنا إطار بيانات جديدًا يزيل اثنين من مستويات العوامل هذه:
#create data frame df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')), sales = c(13, 16, 22, 27, 34)) #view data frame df regional sales 1 to 13 2 B 16 3 C 22 4 D 27 5 E 34 #define new data frame new_df <- subset (df, sales < 25) #view new data frame new_df regional sales 1 to 13 2 B 16 3 C 22 #check levels of region variable levels (new_df$region) [1] “A” “B” “C” “D” “E”
على الرغم من أن قاعدة البيانات الجديدة تحتوي فقط على ثلاثة عوامل في عمود المنطقة ، إلا أنها لا تزال تحتوي على مستويات العوامل الخمسة الأصلية. وهذا من شأنه أن يخلق مشاكل إذا حاولنا إنشاء قطع أرض باستخدام هذه البيانات.
لإزالة مستويات العوامل غير المستخدمة من متغير المنطقة ، يمكننا استخدام الدالة droplevels() :
#drop unused factor levels new_df$region <- droplevels (new_df$region) #check levels of region variable levels (new_df$region) [1] “A” “B” “C”
الآن يحتوي متغير المنطقة على ثلاثة مستويات من العوامل فقط.
يمكنك العثور على المزيد من دروس R على هذه الصفحة .