String ဒြပ်စင်များကိုခွဲရန် r တွင် strsplit() လုပ်ဆောင်ချက်ကိုအသုံးပြုနည်း


R ရှိ strsplit() လုပ်ဆောင်ချက်ကို string တစ်ခုအား အပိုင်းပိုင်းများစွာခွဲရန် အသုံးပြုနိုင်သည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-

strsplit(string၊ ပုံစံ)

ရွှေ-

  • string- စာလုံး vector
  • pattern : ခွဲမည့်ပုံစံ

အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1- Spaces ကိုအခြေခံ၍ စာကြောင်းတစ်ကြောင်းခွဲပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် နေရာလွတ်များကို အခြေခံ၍ စာကြောင်းတစ်ခုကို ခွဲရန် strsplit() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-

 #split string based on spaces
split_up <- strsplit(" Hey there people ", split="")

#view results
split_up

[[1]]
[1] “Hey” “there” “people”

#view class of split_up
class(split_up)

[1] "list"

ရလဒ်သည် မူရင်းစာကြောင်းရှိ နေရာလွတ်များကို အခြေခံ၍ ခွဲခြမ်းထားသော ဒြပ်စင်သုံးမျိုးစာရင်းဖြစ်သည်။

ရလဒ်အဖြစ် vector တစ်ခုကို ထုတ်လုပ်လိုပါက unlist() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

 #split string based on spaces
split_up <- unlist(strsplit(" Hey there people ", split=" "))

#view results
split_up

[1] “Hey” “there” “people”

#view class of split_up
class(split_up)

[1] “character”

ရလဒ်သည် character vector တစ်ခုဖြစ်ကြောင်း ကျွန်ုပ်တို့မြင်နိုင်သည်။

ဥပမာ 2- စိတ်ကြိုက် ကန့်သတ်ချက်တစ်ခုအပေါ် အခြေခံ၍ စာကြောင်းခွဲထားသည်။

မျဉ်းသားချက်ကဲ့သို့သော စိတ်ကြိုက်ကန့်သတ်ချက်တစ်ခုအပေါ်အခြေခံ၍ စာကြောင်းတစ်ခုကိုခွဲရန် strplit() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်သည်။

 #split string based on dashes
strsplit(" Hey-there-people ", split=" - ")

[[1]]
[1] “Hey” “there” “people”

ရလဒ်သည် မူရင်းစာကြောင်း၏ တုံးတိုများပေါ်တွင် အခြေခံထားသော ဒြပ်စင်သုံးမျိုး၏စာရင်းကို ခွဲထားသည်။

ဥပမာ 3- ကန့် သတ်ချက်များစွာကိုအခြေခံ၍ စာကြောင်းတစ်ခုခွဲပါ။

မတူညီသော မျဉ်းသားချက်များစွာကို အခြေခံ၍ string တစ်ခုကို ခွဲရန် strplit() လုပ်ဆောင်ချက်၏ ခွဲထွက်သည့် အငြင်းအခုံတွင် စတုရန်းကွင်းစကွက်များကိုလည်း အသုံးပြုနိုင်ပါသည်။

 #split string based on several delimiters
strsplit(" Hey&there-you/people ", split=" [&-/] ")

[[1]]
[1] “Hey” “there” “you” “people”

ရလဒ်သည် မူရင်းစာကြောင်းတွင် အောက်ဖော်ပြပါ ကန့်သတ်ချက်တစ်ခုရှိသည့်အခါတိုင်း ခွဲထုတ်ထားသော အစိတ်အပိုင်းများစာရင်းဖြစ်သည်-

  • Ampersand ( & )
  • ဒက်ရှ် ( )
  • မျဉ်းစောင်း ( / )

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် စာကြောင်းများဖြင့် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် str_replace ကိုအသုံးပြုနည်း
R တွင် တစ်စိတ်တစ်ပိုင်းစာကြောင်း ကိုက်ညီအောင် မည်သို့လုပ်ဆောင်ရမည်နည်း။
R တွင် string များကို ရက်စွဲများသို့ မည်သို့ပြောင်းရမည်နည်း။
R တွင် အက္ခရာကို ဂဏန်းအဖြစ် ပြောင်းနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်