R တွင် ကျပန်းနမူနာများကို ရွေးချယ်နည်း- ဥပမာများဖြင့်


R တွင် ကျပန်းနမူနာကို ရွေးရန်၊ အောက်ပါ syntax ကိုအသုံးပြုသည့် sample() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

နမူနာ(x၊ အရွယ်အစား၊ အစားထိုး=FALSE၊ prob=NULL)

ရွှေ-

  • x- ရွေးချယ်ရန် အစိတ်အပိုင်းများ၏ vector တစ်ခု။
  • အရွယ်အစား- နမူနာအရွယ်အစား။
  • အစားထိုး- နမူနာဖြင့် အစားထိုးခြင်း ရှိ၊မရှိ၊ မူရင်းတန်ဖိုးသည် မှားနေသည်။
  • prob- vector မှဒြပ်စင်များရယူရန် ဖြစ်နိုင်ခြေအလေးများ၏ vector။ မူရင်းမှာ NULL ဖြစ်သည်။

Vector နှင့် data frame နှစ်ခုလုံးမှ R ရှိ ကျပန်းနမူနာကို ရွေးချယ်ရန် ဤလုပ်ဆောင်ချက်ကို ဤသင်ခန်းစာတွင် ရှင်းပြထားသည်။

ဥပမာ 1- vector တစ်ခုမှ ကျပန်းနမူနာ

အောက်ပါကုဒ်သည် အစားထိုးခြင်းမရှိဘဲ vector တစ်ခုမှ ကျပန်းနမူနာတစ်ခုကို မည်သို့ရွေးချယ်ရမည်ကို ပြသသည်-

 #create vector of data
data <- c(1, 3, 5, 6, 7, 8, 10, 11, 12, 14)

#select random sample of 5 elements without replacement
sample(x=data, size=5)

[1] 10 12 5 14 7

အောက်ပါကုဒ်သည် အစားထိုးသည့် vector တစ်ခုမှ ကျပန်းနမူနာကို မည်သို့ရွေးချယ်ရမည်ကို ပြသသည်-

 #create vector of data
data <- c(1, 3, 5, 6, 7, 8, 10, 11, 12, 14)

#select random sample of 5 elements with replacement
sample(x=data, size=5, replace= TRUE )

[1] 12 1 1 6 14

ဥပမာ 2- ဒေတာဘလောက်တစ်ခုမှ ကျပန်းနမူနာ

အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခုမှ ကျပန်းနမူနာကို မည်သို့ရွေးချယ်ရမည်ကို ပြသသည်-

 #create data frame
df <- data.frame(x=c(3, 5, 6, 6, 8, 12, 14),
                 y=c(12, 6, 4, 23, 25, 8, 9),
                 z=c(2, 7, 8, 8, 15, 17, 29))

#view data frame 
df

   X Y Z
1 3 12 2
2 5 6 7
3 6 4 8
4 6 23 8
5 8 25 15
6 12 8 17
7 14 9 29

#select random sample of three rows from data frame
rand_df <- df[ sample ( nrow (df), size= 3 ), ]

#display randomly selected rows
rand_df

   X Y Z
4 6 23 8
7 14 9 29
1 3 12 2

ဤကုဒ်အပိုင်းအစတွင် ဖြစ်ပျက်နေသည်မှာ ဤအရာဖြစ်သည်-

1. R ရှိ ဒေတာဘောင်တစ်ခု၏ အပိုင်းခွဲတစ်ခုကို ရွေးရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါ syntax ကို အသုံးပြုသည်- df[rows, columns]

2. အထက်ဖော်ပြပါ ကုဒ်တွင်၊ ကျွန်ုပ်တို့သည် ဒေတာဘောင်နှင့် ကော်လံ အားလုံး မှ အတန်း 3 တန်း နမူနာကို ကျပန်းရွေးချယ်ပါသည်။

3. နောက်ဆုံးရလဒ်သည် ကျပန်းရွေးချယ်ထားသောအတန်း 3 ခုပါသည့် ဒေတာဘောင်၏ အပိုင်းခွဲတစ်ခုဖြစ်သည်။

နမူနာ() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့အသုံးပြုသည့်အခါတိုင်း၊ လုပ်ဆောင်ချက်သည် တန်ဖိုးများကို ကျပန်းရွေးချယ်သောကြောင့် R သည် မတူညီသောနမူနာတစ်ခုကို ရွေးချယ်မည်ဖြစ်ကြောင်း သတိပြုရန် အရေးကြီးပါသည်။

အချို့သော ခွဲခြမ်းစိတ်ဖြာမှု၏ ရလဒ်များကို ပြန်လည်ထုတ်ပေးရန်အတွက်၊ နမူနာ() လုပ်ဆောင်ချက်သည် အကြိမ်တိုင်း တူညီသောကျပန်းနမူနာကို ရွေးချယ်ရန်အတွက် set.seed(အချို့နံပါတ်) ကို အသုံးပြုရန် သေချာပါစေ။ ဥပမာအားဖြင့်:

 #make this example reproducible
set.seed(23)

#create data frame
df <- data.frame(x=c(3, 5, 6, 6, 8, 12, 14),
                 y=c(12, 6, 4, 23, 25, 8, 9),
                 z=c(2, 7, 8, 8, 15, 17, 29))

#select random sample of three rows from data frame
rand_df <- df[ sample ( nrow (df), size= 3 ), ]

#display randomly selected rows
rand_df

   X Y Z
5 8 25 15
2 5 6 7
6 12 8 17

အပေါ်ကကုဒ်ကို သင် run တိုင်း၊ တစ်ကြိမ်စီတွင် တူညီသော data frame 3 တန်းကို ရွေးချယ်ပါမည်။

ထပ်လောင်းအရင်းအမြစ်များ

R ဖြင့် အချိုးကျနမူနာ (ဥပမာများနှင့်အတူ)
R ဖြင့် စနစ်တကျ နမူနာယူခြင်း (ဥပမာများနှင့်အတူ)
R in Cluster Sampling- ဥပမာများဖြင့်

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်