R တွင် ဒေတာစံနှုန်းသတ်မှတ်နည်း- ဥပမာများဖြင့်


ဒေတာအတွဲကို စံသတ်မှတ်ခြင်း သည် ပျမ်းမျှတန်ဖိုးသည် 0 ဖြစ်ပြီး စံသွေဖည်မှုမှာ 1 ဖြစ်သည့်အတွက် ဒေတာအတွဲရှိ တန်ဖိုးအားလုံးကို အတိုင်းအတာကို ချဲ့ထွင်ခြင်းဖြစ်သည်။

၎င်းကိုလုပ်ဆောင်ရန် အသုံးအများဆုံးနည်းလမ်းမှာ အောက်ပါဖော်မြူလာကို အသုံးပြု၍ တန်ဖိုးများကို ချိန်ညှိပေးသည့် z-score စံသတ်မှတ်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်-

(x ix ) / s

ရွှေ-

  • x i : dataset ၏ ith တန်ဖိုး
  • x : နမူနာကိုဆိုလိုသည်။
  • s : နမူနာ၏ စံသွေဖည်မှု

အောက်ပါနမူနာများသည် z-score စံသတ်မှတ်ချက်ကို အသုံးပြု၍ ဒေတာဘောင်အတွင်း တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်များကို အတိုင်းအတာတစ်ခုအထိ အတိုင်းအတာတစ်ခုအထိ R ရှိ dplyr ပက်ကေ့ချ်ဖြင့် စကေး() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသထားသည်။

ကိန်းရှင်တစ်ခုတည်းကို စံသတ်မှတ်ပါ။

အောက်ပါကုဒ်သည် ကိန်းရှင်သုံးခုပါသော ဒေတာဘောင်တစ်ခုအတွင်း ကိန်းရှင်တစ်ခုအား အတိုင်းအတာတစ်ခုအထိ အတိုင်းအတာကိုပြသသည်-

 library (dplyr)

#make this example reproducible 
set.seed(1)

#create original data frame
df <- data.frame(var1= runif(10, 0, 50), 
                 var2= runif(10, 2, 23),
                 var3= runif(10, 5, 38))

#view original data frame
df

        var1 var2 var3
1 13.275433 6.325466 35.845273
2 18.606195 5.707692 12.000703
3 28.642668 16.427480 26.505234
4 45.410389 10.066178 9.143318
5 10.084097 18.166670 13.818282
6 44.919484 12.451684 17.741765
7 47.233763 17.069989 5.441881
8 33.039890 22.830028 17.618803
9 31.455702 9.980739 33.699798
10 3.089314 18.326350 16.231517

#scale var1 to have mean = 0 and standard deviation = 1
df2 <- df %>% mutate_at (c(' var1 '), ~( scale (.) %>% as.vector ))
df2

          var1 var2 var3
1 -0.90606801 6.325466 35.845273
2 -0.56830963 5.707692 12.000703
3 0.06760377 16.427480 26.505234
4 1.13001072 10.066178 9.143318
5 -1.10827188 18.166670 13.818282
6 1.09890684 12.451684 17.741765
7 1.24554014 17.069989 5.441881
8 0.34621281 22.830028 17.618803
9 0.24583830 9.980739 33.699798
10 -1.55146305 18.326350 16.231517

ပထမ variable တစ်ခုတည်းကိုသာ scaled လုပ်ထားသော်လည်း အခြား variable နှစ်ခုသည် တူညီနေပါသည်။ အတိုင်းအတာ ကိန်းရှင်အသစ်တွင် ပျမ်းမျှတန်ဖိုး 0 နှင့် စံသွေဖည်မှု 1 ရှိကြောင်း အမြန်အတည်ပြုနိုင်သည်-

 #calculate mean of scaled variable
mean(df2$var1)

[1] -4.18502e-18 #basically zero

#calculate standard deviation of scaled variable 
sd(df2$var1)

[1] 1

ကိန်းရှင်များစွာကို စံသတ်မှတ်ပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် ဒေတာဘောင်တစ်ခုတွင် ကိန်းရှင်များစွာကို တစ်ကြိမ်တည်းစကေးချနည်းကို ပြသသည်-

 library (dplyr)

#make this example reproducible 
set.seed(1)

#create original data frame
df <- data.frame(var1= runif(10, 0, 50), 
                 var2= runif(10, 2, 23),
                 var3= runif(10, 5, 38))

#scale var1 and var2 to have mean = 0 and standard deviation = 1
df3 <- df %>% mutate_at (c(' var1 ', ' var2 '), ~( scale (.) %>% as.vector ))
df3

          var1 var2 var3
1 -0.90606801 -1.3045574 35.845273
2 -0.56830963 -1.4133223 12.000703
3 0.06760377 0.4739961 26.505234
4 1.13001072 -0.6459703 9.143318
5 -1.10827188 0.7801967 13.818282
6 1.09890684 -0.2259798 17.741765
7 1.24554014 0.5871157 5.441881
8 0.34621281 1.6012242 17.618803
9 0.24583830 -0.6610127 33.699798
10 -1.55146305 0.8083098 16.231517

ကိန်းရှင်အားလုံးကို စံသတ်မှတ်ပါ။

အောက်ပါကုဒ်သည် mutate_all လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာဘောင်တစ်ခုအတွင်းရှိ ကိန်းရှင် အားလုံးကို အတိုင်းအတာတစ်ခုအထိ အတိုင်းအတာကို ပြသသည်-

 library (dplyr)

#make this example reproducible 
set.seed(1)

#create original data frame
df <- data.frame(var1= runif(10, 0, 50), 
                 var2= runif(10, 2, 23),
                 var3= runif(10, 5, 38))

#scale all variables to have mean = 0 and standard deviation = 1
df4 <- df %>% mutate_all (~( scale (.) %>% as.vector ))
df4

          var1 var2 var3
1 -0.90606801 -1.3045574 1.6819976
2 -0.56830963 -1.4133223 -0.6715858
3 0.06760377 0.4739961 0.7600871
4 1.13001072 -0.6459703 -0.9536246
5 -1.10827188 0.7801967 -0.4921813
6 1.09890684 -0.2259798 -0.1049130
7 1.24554014 0.5871157 -1.3189757
8 0.34621281 1.6012242 -0.1170501
9 0.24583830 -0.6610127 1.4702281
10 -1.55146305 0.8083098 -0.2539824

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင်ဒေတာကိုပုံမှန်ဖြစ်အောင်လုပ်နည်း
R တွင် စံသွေဖည်တွက်ချက်နည်း
R တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများအားလုံးကို မည်သို့အပြစ်တင်မည်နည်း။
R (Log၊ Square Root၊ Cube Root) ဖြင့် Data ကိုဘယ်လိုပြောင်းမလဲ

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်