ဒေတာခွဲခြမ်းရန် r တွင် split() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။


R ရှိ split() လုပ်ဆောင်ချက်ကို ကိန်းဂဏန်းအဆင့်များအလိုက် အုပ်စုများခွဲရန် အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-

ပိုင်းခြားခြင်း(x၊ f၊ …)

ရွှေ-

  • x : အုပ်စုများခွဲရန် vector သို့မဟုတ် data block ၏အမည်
  • f : အုပ်စုများကို သတ်မှတ်သည့်အချက်

အောက်ပါဥပမာများသည် vector များနှင့် data frames များကို အုပ်စုများခွဲရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသထားသည်။

ဥပမာ 1- vector ကို အုပ်စုများခွဲရန် split() ကိုသုံးပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် ကိန်းဂဏာန်းအဆင့်များပေါ်တွင် အခြေခံ၍ ဒေတာတန်ဖိုးများကို အုပ်စုများအဖြစ် ပိုင်းခြားပုံပြသည်-

 #create vector of data values
data <- c(1, 2, 3, 4, 5, 6)

#create vector of groupings
groups <- c('A', 'B', 'B', 'B', 'C', 'C')

#split vector of data values into groups
split(x = data, f = groups)

$A
[1] 1

$B
[1] 2 3 4

$C
[1] 5 6

ရလဒ်မှာ အုပ်စုသုံးစုဖြစ်သည်။

သတ်မှတ်ထားသောအုပ်စုများကို ပြန်လည်ရယူရန် ညွှန်းကိန်းပြုလုပ်ခြင်းကိုလည်း အသုံးပြုနိုင်ကြောင်း သတိပြုပါ-

 #split vector of data values into groups and only display second group
split(x = data, f = groups)[2]

$B
[1] 2 3 4

ဥပမာ 2- data frame ကို အုပ်စုများခွဲရန် split() ကိုသုံးပါ။

R တွင် အောက်ပါ data frame ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'G', 'F', 'F'),
                 points=c(33, 28, 31, 39, 34, 44),
                 assists=c(30, 28, 24, 24, 28, 19))

#view data frame
df

  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24
4 BG 39 24
5 BF 34 28
6 BF 44 19

“ အဖွဲ့” variable ကို အခြေခံ၍ ဒေတာဘောင်ကို အုပ်စုများခွဲရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်ပါသည်။

 #split data frame into groups based on 'team'
split(df, f = df$team)

$A
  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24

$B
  team position points assists
4 BG 39 24
5 BF 34 28
6 BF 44 19

ရလဒ်မှာ အုပ်စုနှစ်စုဖြစ်သည်။ ပထမတွင် “ အသင်း” သည် A နှင့် ညီမျှသည့် လိုင်းများသာ ပါရှိပြီး ဒုတိယတွင် “ အသင်း” သည် B နှင့် ညီမျှသည့် လိုင်းများသာ ပါရှိသည်။

ကိန်းရှင်အများအပြားကို အသုံးပြု၍ ဒေတာကို အုပ်စုများအဖြစ် ခွဲနိုင်သည်ကို သတိပြုပါ။ ဥပမာအားဖြင့်၊ အောက်ပါကုဒ်သည် “ အဖွဲ့” နှင့် “ ရာထူး” ကိန်းရှင်များကို အခြေခံ၍ ဒေတာအုပ်စုများသို့ အုပ်စုများခွဲနည်းကို ပြသသည်-

 #split data frame into groups based on 'team' and 'position' variables
split(df, f = list(df$team, df$position))

$AF
  team position points assists
3 AF 31 24

$BF
  team position points assists
5 BF 34 28
6 BF 44 19

$AG
  team position points assists
1 GA 33 30
2 AG 28 28

$BG
  team position points assists
4 BG 39 24

ရလဒ်မှာ အုပ်စုလေးခုဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ရှင်းပြထားပါသည်။

R တွင် summary() function ကိုအသုံးပြုနည်း
R တွင် replicate() function ကိုအသုံးပြုနည်း
R တွင် match() function ကိုအသုံးပြုနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်