كيفية استخدام وظيفة الدمج () في dplyr (مع أمثلة)
يمكنك استخدام وظيفة الدمج () من الحزمة dplyr في R لإرجاع القيمة الأولى غير المفقودة في كل موضع لمتجه واحد أو أكثر.
هناك طريقتان شائعتان لاستخدام هذه الوظيفة:
الطريقة الأولى: استبدال القيم المفقودة في المتجه
library (dplyr)
#replace missing values with 100
coalescence(x, 100)
الطريقة الثانية: إرجاع القيمة الأولى غير المفقودة في أعمدة إطار البيانات
library (dplyr)
#return first non-missing value at each position across columns A and B
coalesce(df$A, df$B)
توضح الأمثلة التالية كيفية تطبيق كل طريقة عمليًا.
مثال 1: استخدم الدمج () لاستبدال القيم المفقودة في المتجه
يوضح التعليمة البرمجية التالية كيفية استخدام وظيفة الدمج () لاستبدال جميع القيم المفقودة في المتجه بقيمة 100:
library (dplyr) #create vector of values x <- c(4, NA, 12, NA, 5, 14, 19) #replace missing values with 100 coalescence(x, 100) [1] 4 100 12 100 5 14 19
لاحظ أنه تم استبدال كل قيمة NA في المتجه الأصلي بقيمة 100 .
المثال 2: استخدم الدمج () لإرجاع القيمة الأولى غير المفقودة في أعمدة إطار البيانات
لنفترض أن لدينا إطار البيانات التالي في R:
#create data frame
df <- data. frame (A=c(10, NA, 5, 6, NA, 7, NA),
B=c(14, 9, NA, 3, NA, 10, 4))
#view data frame
df
AB
1 10 14
2 NA 9
3 5 NA
4 6 3
5 NA NA
6 7 10
7 NA 4
يوضح التعليمة البرمجية التالية كيفية استخدام وظيفة الدمج () لإرجاع القيمة الأولى غير المفقودة في العمودين A وB من إطار البيانات:
library (dplyr)
#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B)
#view updated data frame
df
ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA NA
6 7 10 7
7 NA 4 4
يحتوي العمود الناتج C على القيمة الأولى غير المفقودة في العمودين A وB.
لاحظ أن الصف 5 يحتوي على قيمة NA في العمود C نظرًا لأن العمودين A وB يحتويان على قيم NA في هذا الصف.
يمكننا ببساطة إضافة قيمة إضافية إلى دالة الدمج () لاستخدامها كقيمة إذا كانت هناك قيم NA في كل عمود:
library (dplyr)
#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B, 100)
#view updated data frame
df
ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA 100
6 7 10 7
7 NA 4 4
لاحظ أنه تم الآن استبدال قيمة NA في الصف 5 من العمود C بقيمة 100 .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ وظائف شائعة أخرى باستخدام dplyr:
كيفية حذف الصفوف باستخدام dplyr
كيفية ترتيب الصفوف باستخدام dplyr
كيفية التصفية حسب شروط متعددة باستخدام dplyr