String ဒြပ်စင်များကိုခွဲရန် r တွင် strsplit() လုပ်ဆောင်ချက်ကိုအသုံးပြုနည်း
R ရှိ strsplit() လုပ်ဆောင်ချက်ကို string တစ်ခုအား အပိုင်းပိုင်းများစွာခွဲရန် အသုံးပြုနိုင်သည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-
strsplit(string၊ ပုံစံ)
ရွှေ-
- string- စာလုံး vector
- pattern : ခွဲမည့်ပုံစံ
အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ 1- Spaces ကိုအခြေခံ၍ စာကြောင်းတစ်ကြောင်းခွဲပါ။
အောက်ဖော်ပြပါ ကုဒ်သည် နေရာလွတ်များကို အခြေခံ၍ စာကြောင်းတစ်ခုကို ခွဲရန် strsplit() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-
#split string based on spaces
split_up <- strsplit(" Hey there people ", split="")
#view results
split_up
[[1]]
[1] “Hey” “there” “people”
#view class of split_up
class(split_up)
[1] "list"
ရလဒ်သည် မူရင်းစာကြောင်းရှိ နေရာလွတ်များကို အခြေခံ၍ ခွဲခြမ်းထားသော ဒြပ်စင်သုံးမျိုးစာရင်းဖြစ်သည်။
ရလဒ်အဖြစ် vector တစ်ခုကို ထုတ်လုပ်လိုပါက unlist() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
#split string based on spaces
split_up <- unlist(strsplit(" Hey there people ", split=" "))
#view results
split_up
[1] “Hey” “there” “people”
#view class of split_up
class(split_up)
[1] “character”
ရလဒ်သည် character vector တစ်ခုဖြစ်ကြောင်း ကျွန်ုပ်တို့မြင်နိုင်သည်။
ဥပမာ 2- စိတ်ကြိုက် ကန့်သတ်ချက်တစ်ခုအပေါ် အခြေခံ၍ စာကြောင်းခွဲထားသည်။
မျဉ်းသားချက်ကဲ့သို့သော စိတ်ကြိုက်ကန့်သတ်ချက်တစ်ခုအပေါ်အခြေခံ၍ စာကြောင်းတစ်ခုကိုခွဲရန် strplit() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်သည်။
#split string based on dashes
strsplit(" Hey-there-people ", split=" - ")
[[1]]
[1] “Hey” “there” “people”
ရလဒ်သည် မူရင်းစာကြောင်း၏ တုံးတိုများပေါ်တွင် အခြေခံထားသော ဒြပ်စင်သုံးမျိုး၏စာရင်းကို ခွဲထားသည်။
ဥပမာ 3- ကန့် သတ်ချက်များစွာကိုအခြေခံ၍ စာကြောင်းတစ်ခုခွဲပါ။
မတူညီသော မျဉ်းသားချက်များစွာကို အခြေခံ၍ string တစ်ခုကို ခွဲရန် strplit() လုပ်ဆောင်ချက်၏ ခွဲထွက်သည့် အငြင်းအခုံတွင် စတုရန်းကွင်းစကွက်များကိုလည်း အသုံးပြုနိုင်ပါသည်။
#split string based on several delimiters
strsplit(" Hey&there-you/people ", split=" [&-/] ")
[[1]]
[1] “Hey” “there” “you” “people”
ရလဒ်သည် မူရင်းစာကြောင်းတွင် အောက်ဖော်ပြပါ ကန့်သတ်ချက်တစ်ခုရှိသည့်အခါတိုင်း ခွဲထုတ်ထားသော အစိတ်အပိုင်းများစာရင်းဖြစ်သည်-
- Ampersand ( & )
- ဒက်ရှ် ( – )
- မျဉ်းစောင်း ( / )
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် စာကြောင်းများဖြင့် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် str_replace ကိုအသုံးပြုနည်း
R တွင် တစ်စိတ်တစ်ပိုင်းစာကြောင်း ကိုက်ညီအောင် မည်သို့လုပ်ဆောင်ရမည်နည်း။
R တွင် string များကို ရက်စွဲများသို့ မည်သို့ပြောင်းရမည်နည်း။
R တွင် အက္ခရာကို ဂဏန်းအဖြစ် ပြောင်းနည်း