كيفية استخدام دالة السلسلة الفرعية في r (4 أمثلة)


يمكن استخدام الدالة substring() في R لاستخراج سلسلة فرعية في ناقل الأحرف.

تستخدم هذه الوظيفة بناء الجملة التالي:

 substring(text, first, last)

ذهب:

  • النص: اسم ناقل الحرف
  • أولاً: العنصر الأول المراد استخراجه
  • last: العنصر الأخير الذي سيتم استخراجه

لاحظ أيضًا أن الدالة substr() ‎ تقوم بنفس الشيء تمامًا، ولكن مع أسماء وسائط مختلفة قليلًا:

 substr(text, first, last)

ذهب:

  • x: اسم ناقل الحرف
  • start: العنصر الأول المراد استخراجه
  • توقف: العنصر الأخير لاستخراجه

توضح الأمثلة في هذا البرنامج التعليمي كيفية استخدام الدالة substring() عمليًا مع إطار البيانات التالي في R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

مثال 1: استخراج الأحرف بين مواضع معينة

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة substring() لاستخراج الأحرف بين الموضعين 2 و5 من عمود “الفريق”:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

لاحظ أن العمود الجديد يحتوي على الأحرف الموجودة بين الموضعين 2 و5 في عمود “الفريق”.

مثال 2: استخراج الأحرف N الأولى

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة substring() لاستخراج الأحرف الثلاثة الأولى من عمود “الفريق”:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

لاحظ أن العمود الجديد يحتوي على الأحرف الثلاثة الأولى من عمود “الفريق”.

مثال 3: استخراج آخر أحرف N

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة substring() لاستخراج آخر 3 أحرف من عمود “الفريق”:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

لاحظ أن العمود الجديد يحتوي على الأحرف الثلاثة الأخيرة من عمود “الفريق”.

المثال 4: استبدال سلسلة فرعية

يوضح الكود التالي كيفية استخدام الدالة substring() لاستبدال الأحرف الثلاثة الأولى من القيم الموجودة في عمود “الفريق” بثلاث علامات نجمية:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

لاحظ أنه تم استبدال الأحرف الثلاثة الأولى من اسم كل فريق بعلامات نجمية.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية إجراء عمليات شائعة أخرى باستخدام السلاسل في لغة R:

كيفية استخدام str_replace في R
كيفية إجراء مطابقة السلسلة الجزئية في R
كيفية تحويل السلاسل إلى تواريخ في R
كيفية تحويل الحرف إلى رقمي في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *