كيفية حساب الكلمات في سلسلة في لغة r (مع أمثلة)
هناك ثلاث طرق يمكنك استخدامها لحساب عدد الكلمات في سلسلة في R:
الطريقة الأولى: استخدم Base R
lengths(strsplit(my_string, ' '))
الطريقة الثانية: استخدم حزمة stringi
library (stringi)
stri_count_words(my_string)
الطريقة الثالثة: استخدم حزمة stringr
library (stringr) str_count(my_string, ' \\w+ ')
ستُرجع كل طريقة من هذه الطرق قيمة رقمية تمثل عدد الكلمات في السلسلة المسماة my_string .
توضح الأمثلة التالية كيفية استخدام كل من هذه الطرق عمليًا.
مثال 1: عد الكلمات باستخدام الأساس R
يوضح التعليمة البرمجية التالية كيفية حساب عدد الكلمات في سلسلة باستخدام دالات R الأساسية lengths و strsplit :
#create string my_string <- 'this is a string with seven words' #count number of words in string lengths(strsplit(my_string, ' ')) [1] 7
ومن النتيجة، يمكننا أن نرى أن هناك سبع كلمات في السلسلة.
ذات صلة: كيفية استخدام الدالة strsplit() في R لتقسيم عناصر السلسلة
مثال 2: عد الكلمات باستخدام حزمة stringi
يوضح التعليمة البرمجية التالية كيفية حساب عدد الكلمات في سلسلة باستخدام وظيفة stri_count_words من حزمة stringi في R:
library (stringi) #create string my_string <- 'this is a string with seven words' #count number of words in string stri_count_words(my_string) [1] 7
ومن النتيجة، يمكننا أن نرى أن هناك سبع كلمات في السلسلة.
مثال 3: عد الكلمات باستخدام حزمة stringr
يوضح التعليمة البرمجية التالية كيفية حساب عدد الكلمات في سلسلة باستخدام الدالة str_count من حزمة stringr في R:
library (stringr) #create string my_string <- 'this is a string with seven words' #count number of words in string str_count(my_string, ' \\w+ ') [1] 7
ومن النتيجة، يمكننا أن نرى أن هناك سبع كلمات في السلسلة.
لاحظ أننا استخدمنا التعبير العادي \\w+ لمطابقة الأحرف غير الكلمة مع علامة + للإشارة إلى واحد أو أكثر في صف واحد.
ملاحظة : في كل من هذه الأمثلة، قمنا بإحصاء عدد الكلمات في سلسلة واحدة، ولكن كل طريقة ستعمل أيضًا مع متجهات السلاسل.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:
كيفية العثور على موقع الحرف في سلسلة في R
كيفية إزالة الأحرف من سلسلة في R
كيفية تحديد الأعمدة التي تحتوي على سلسلة محددة في R