R တွင် sample လုပ်ဆောင်ချက်ကို အသုံးပြု၍ နမူနာတစ်ခုကို မည်သို့ထုတ်လုပ်မည်နည်း။
R ရှိ sample() လုပ်ဆောင်ချက်သည် သင့်အား ဒေတာအတွဲ သို့မဟုတ် vector တစ်ခုမှ အစိတ်အပိုင်းများ၏ ကျပန်းနမူနာကို အစားထိုးခြင်းဖြင့် သို့မဟုတ် မပါဘဲ ယူနိုင်စေပါသည်။
sample() function ၏ အခြေခံ syntax မှာ-
နမူနာ (x၊ အရွယ်အစား၊ အစားထိုး = FALSE ၊ prob = NULL )
x : နမူနာကို ရွေးချယ်ရမည့် ဒေတာအတွဲ သို့မဟုတ် vector
အရွယ်အစား : နမူနာအရွယ်အစား
အစားထိုး : အစားထိုးနမူနာကို အစားထိုးလုပ်ဆောင်သင့်ပါသလား။ (မူရင်းအားဖြင့် ၎င်းသည် မှားသည်)
prob : နမူနာယူထားသော vector ၏ဒြပ်စင်များရရှိရန် ဖြစ်နိုင်ခြေအလေးများ၏ vector တစ်ခု
နမူနာ() အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ကြည့်ရှုနိုင်ပါသည်။
အောက်ဖော်ပြပါ ဥပမာများသည် sample() ကိုအသုံးပြုခြင်း၏ လက်တွေ့နမူနာများကို သရုပ်ပြပါသည်။
vector တစ်ခုမှနမူနာတစ်ခုဖန်တီးပါ။
ကျွန်ုပ်တို့တွင် ဒြပ်စင် 10 ပါရှိသော vector တစ်ခုရှိသည် ဆိုပါစို့။
#define vector a with 10 elements in it
a <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
အစားထိုးခြင်းမရှိဘဲ vector a ၏ ကျပန်းနမူနာ 5 ခုကို ထုတ်လုပ်ရန်၊ အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#generate random sample of 5 elements from vector a
sample(a, 5)
#[1] 3 1 4 7 5
ကျပန်းနမူနာကို ထုတ်ပေးလိုက်တိုင်း၊ အကြိမ်တိုင်း မတူညီသော ပစ္စည်းအစုံကို ရနိုင်ဖွယ်ရှိကြောင်း သတိပြုရန် အရေးကြီးပါသည်။
#generate another random sample of 5 elements from vector a
sample(a, 5)
#[1] 1 8 7 4 2
ကျွန်ုပ်တို့သည် ကျွန်ုပ်တို့၏ရလဒ်များကို ပုံတူပွားပြီး အကြိမ်တိုင်း တူညီသောနမူနာဖြင့် လုပ်ဆောင်လိုပါက set.seed() ကို အသုံးပြုနိုင်ပါသည်။
#set.seed(some random number) to ensure that we get the same sample each time set.seed(122) #define vector a with 10 elements in it a <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10) #generate random sample of 5 elements from vector a sample(a, 5) #[1] 10 9 2 1 4 #generate another random sample of 5 elements from vector a sample(a, 5) #[1] 10 9 2 1 4
နမူနာကို အစားထိုးရန် အစားထိုး = TRUE အကြောင်းပြချက်ကိုလည်း သုံးနိုင်သည်။ ဆိုလိုသည်မှာ vector ၏ဒြပ်စင်တစ်ခုစီကို နမူနာတွင် တစ်ကြိမ်ထက်ပို၍ပြသရန် ရွေးချယ်နိုင်သည်။
#generate random sample of 5 elements from vector a using sampling with replacement
sample(a, 5, replace = TRUE)
#10 10 2 1 6
ဒေတာအတွဲတစ်ခုမှ နမူနာတစ်ခုကို ဖန်တီးပါ။
sample() function ၏နောက်ထပ် အသုံးများသည့်အချက်မှာ data set တစ်ခုမှ အတန်းများ၏ ကျပန်းနမူနာကို ထုတ်လုပ်ရန်ဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာအတွက်၊ စုစုပေါင်း အတန်း 150 တန်းရှိသည့် R dataset iris မှ ကျပန်းနမူနာ 10 တန်းကို ထုတ်လုပ်ပါမည်။
#view first 6 rows of iris dataset head(iris) # Sepal.Length Sepal.Width Petal.Length Petal.Width Species #1 5.1 3.5 1.4 0.2 setosa #2 4.9 3.0 1.4 0.2 setosa #3 4.7 3.2 1.3 0.2 setosa #4 4.6 3.1 1.5 0.2 setosa #5 5.0 3.6 1.4 0.2 setosa #6 5.4 3.9 1.7 0.4 setosa #set seed to ensure that this example is replicable set.seed(100) #choose a random vector of 10 elements from all 150 rows in iris dataset sample_rows <- sample(1:nrow(iris), 10) sample_rows #[1] 47 39 82 9 69 71 117 53 78 25 #choose the 10 rows of the iris dataset that match the row numbers above sample <- iris[sample_rows, ] sample # Sepal.Length Sepal.Width Petal.Length Petal.Width Species #47 5.1 3.8 1.6 0.2 setosa #39 4.4 3.0 1.3 0.2 setosa #82 5.5 2.4 3.7 1.0 versicolor #9 4.4 2.9 1.4 0.2 setosa #69 6.2 2.2 4.5 1.5 versicolor #71 5.9 3.2 4.8 1.8 versicolor #117 6.5 3.0 5.5 1.8 virginica #53 6.9 3.1 4.9 1.5 versicolor #78 6.7 3.0 5.0 1.7 versicolor #25 4.8 3.4 1.9 0.2 setosa
အထက်ကကုဒ်ကို သင့်ကိုယ်ပိုင် R ကွန်ဆိုးလ်တွင် ကူးယူပြီး ကူးထည့်ပါက၊ ကျွန်ုပ်တို့သည် အချိန်တိုင်း တူညီသောနမူနာကို ရရှိကြောင်းသေချာစေရန် set.seed(100) ကို အသုံးပြုပြီးကတည်းက တူညီသောနမူနာကို ရရှိသင့်ပါသည်။