كيفية استخدام وظيفة الدمج () في dplyr (مع أمثلة)


يمكنك استخدام وظيفة الدمج () من الحزمة dplyr في R لإرجاع القيمة الأولى غير المفقودة في كل موضع لمتجه واحد أو أكثر.

هناك طريقتان شائعتان لاستخدام هذه الوظيفة:

الطريقة الأولى: استبدال القيم المفقودة في المتجه

 library (dplyr)

#replace missing values with 100
coalescence(x, 100)

الطريقة الثانية: إرجاع القيمة الأولى غير المفقودة في أعمدة إطار البيانات

 library (dplyr)

#return first non-missing value at each position across columns A and B
coalesce(df$A, df$B)

توضح الأمثلة التالية كيفية تطبيق كل طريقة عمليًا.

مثال 1: استخدم الدمج () لاستبدال القيم المفقودة في المتجه

يوضح التعليمة البرمجية التالية كيفية استخدام وظيفة الدمج () لاستبدال جميع القيم المفقودة في المتجه بقيمة 100:

 library (dplyr)

#create vector of values
x <- c(4, NA, 12, NA, 5, 14, 19)

#replace missing values with 100
coalescence(x, 100)

[1] 4 100 12 100 5 14 19

لاحظ أنه تم استبدال كل قيمة NA في المتجه الأصلي بقيمة 100 .

المثال 2: استخدم الدمج () لإرجاع القيمة الأولى غير المفقودة في أعمدة إطار البيانات

لنفترض أن لدينا إطار البيانات التالي في R:

 #create data frame
df <- data. frame (A=c(10, NA, 5, 6, NA, 7, NA),
                 B=c(14, 9, NA, 3, NA, 10, 4))

#view data frame
df

   AB
1 10 14
2 NA 9
3 5 NA
4 6 3
5 NA NA
6 7 10
7 NA 4

يوضح التعليمة البرمجية التالية كيفية استخدام وظيفة الدمج () لإرجاع القيمة الأولى غير المفقودة في العمودين A وB من إطار البيانات:

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA NA
6 7 10 7
7 NA 4 4

يحتوي العمود الناتج C على القيمة الأولى غير المفقودة في العمودين A وB.

لاحظ أن الصف 5 يحتوي على قيمة NA في العمود C نظرًا لأن العمودين A وB يحتويان على قيم NA في هذا الصف.

يمكننا ببساطة إضافة قيمة إضافية إلى دالة الدمج () لاستخدامها كقيمة إذا كانت هناك قيم NA في كل عمود:

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B, 100)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA 100
6 7 10 7
7 NA 4 4

لاحظ أنه تم الآن استبدال قيمة NA في الصف 5 من العمود C بقيمة 100 .

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ وظائف شائعة أخرى باستخدام dplyr:

كيفية حذف الصفوف باستخدام dplyr
كيفية ترتيب الصفوف باستخدام dplyr
كيفية التصفية حسب شروط متعددة باستخدام dplyr

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *