ج: كيفية استخدام strsplit() مع محددات متعددة


يمكنك استخدام بناء الجملة الأساسي التالي مع الدالة strsplit() في R لتقسيم سلسلة إلى أجزاء بناءً على محددات متعددة:

 strsplit(my_string, ' [,& ]+ ')

يقوم هذا المثال تحديدًا بتقسيم السلسلة المسماة my_string عندما تواجه أحد المحددات الثلاثة التالية:

  • فاصلة ( ، )
  • علامة الضم ( & )
  • منطقة

لاحظ أن الأحرف الموجودة بين قوسين تشير إلى المحددات التي يجب البحث عنها، وتشير العلامة + إلى احتمال وجود محددات متعددة في صف واحد (على سبيل المثال، قد تكون هناك مسافات متعددة في صف واحد).

يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.

مثال: استخدم strsplit() مع محددات متعددة في R

لنفترض أن لدينا السلسلة التالية في R:

 #create string
my_string <- 'this is a, string & with seven words'

إذا استخدمنا الدالة strsplit() لتقسيم السلسلة في كل مرة تتم فيها مواجهة مسافة، فسوف تنتج النتيجة التالية:

 #split string based on spaces
strsplit(my_string, ' ')

[[1]]
 [1] "this" "is" "a," "string" "&" "with" "" ""      
 [9] “seven” “words”

تقوم الدالة strsplit() بتقسيم السلسلة عند مواجهة مسافة، ولكنها غير قادرة على التعامل مع الفواصل وعلامات الضم والمسافات المتعددة.

لتقسيم السلسلة بناءً على كل من هذه المحددات، يمكننا استخدام الصيغة التالية:

 #split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')

[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words" 

هذه الوظيفة قادرة على تقسيم السلسلة بناءً على ثلاثة محددات مختلفة وترجع بشكل صحيح فقط الكلمات الموجودة في السلسلة التي نهتم بها.

لاحظ أننا في هذا المثال قمنا بتضمين ثلاثة محددات بين قوسين في الدالة strsplit() ولكن يمكنك تحديد أي عدد تريده من المحددات.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية إجراء عمليات شائعة أخرى باستخدام dplyr:

كيفية استخدام الدالة strsplit() في R لتقسيم عناصر السلسلة
كيفية تقسيم سلسلة والحصول على العنصر الأول في R
كيفية حساب الكلمات في سلسلة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *