كيفية حساب الكلمات في سلسلة في لغة r (مع أمثلة)


هناك ثلاث طرق يمكنك استخدامها لحساب عدد الكلمات في سلسلة في R:

الطريقة الأولى: استخدم Base R

 lengths(strsplit(my_string, ' '))

الطريقة الثانية: استخدم حزمة stringi

 library (stringi)

stri_count_words(my_string)

الطريقة الثالثة: استخدم حزمة stringr

 library (stringr)

str_count(my_string, ' \\w+ ')

ستُرجع كل طريقة من هذه الطرق قيمة رقمية تمثل عدد الكلمات في السلسلة المسماة my_string .

توضح الأمثلة التالية كيفية استخدام كل من هذه الطرق عمليًا.

مثال 1: عد الكلمات باستخدام الأساس R

يوضح التعليمة البرمجية التالية كيفية حساب عدد الكلمات في سلسلة باستخدام دالات R الأساسية lengths و strsplit :

 #create string
my_string <- 'this is a string with seven words'

#count number of words in string
lengths(strsplit(my_string, ' '))

[1] 7

ومن النتيجة، يمكننا أن نرى أن هناك سبع كلمات في السلسلة.

ذات صلة: كيفية استخدام الدالة strsplit() في R لتقسيم عناصر السلسلة

مثال 2: عد الكلمات باستخدام حزمة stringi

يوضح التعليمة البرمجية التالية كيفية حساب عدد الكلمات في سلسلة باستخدام وظيفة stri_count_words من حزمة stringi في R:

 library (stringi)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
stri_count_words(my_string)

[1] 7

ومن النتيجة، يمكننا أن نرى أن هناك سبع كلمات في السلسلة.

مثال 3: عد الكلمات باستخدام حزمة stringr

يوضح التعليمة البرمجية التالية كيفية حساب عدد الكلمات في سلسلة باستخدام الدالة str_count من حزمة stringr في R:

 library (stringr)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
str_count(my_string, ' \\w+ ')

[1] 7

ومن النتيجة، يمكننا أن نرى أن هناك سبع كلمات في السلسلة.

لاحظ أننا استخدمنا التعبير العادي \\w+ لمطابقة الأحرف غير الكلمة مع علامة + للإشارة إلى واحد أو أكثر في صف واحد.

ملاحظة : في كل من هذه الأمثلة، قمنا بإحصاء عدد الكلمات في سلسلة واحدة، ولكن كل طريقة ستعمل أيضًا مع متجهات السلاسل.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:

كيفية العثور على موقع الحرف في سلسلة في R
كيفية إزالة الأحرف من سلسلة في R
كيفية تحديد الأعمدة التي تحتوي على سلسلة محددة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *