R တွင် ဒေတာကို အလယ်ဗဟိုပြုနည်း (ဥပမာများဖြင့်)


ဒေတာအစုံကို ဗဟိုပြုခြင်း ဆိုသည်မှာ ဒေတာအစုအတွင်း တစ်ဦးချင်းစီ ကြည့်ရှုမှုတစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို နုတ်ယူခြင်းဖြစ်သည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။

ပျမ်းမျှတန်ဖိုးသည် 14 ဖြစ်ကြောင်း တွေ့ရှိရပါသည်။ ထို့ကြောင့်၊ ဤဒေတာအတွဲကို ဗဟိုပြုရန်၊ တစ်ဦးချင်းစီ ရှုမြင်ချက်တစ်ခုစီမှ 14 ကို နုတ်ယူပါမည်-

ဒေတာစင်တာကိုဘယ်လိုလုပ်မလဲ။

ဗဟိုပြုဒေတာအတွဲ၏ ပျမ်းမျှတန်ဖိုးသည် သုညဖြစ်ကြောင်း သတိပြုပါ။

ဤကျူတိုရီရယ်တွင် R တွင်ဒေတာကိုဗဟိုပြုပုံဥပမာများစွာကိုပေးသည်။

ဥပမာ 1: vector တစ်ခု၏ တန်ဖိုးများကို ဗဟိုပြုပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် vector တစ်ခုရှိ တန်ဖိုးများကို ဗဟိုပြုရန်အတွက် base R scale() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #createvector
data <- c(4, 6, 9, 13, 14, 17, 18, 19, 19, 21)

#subtract the mean value from each observation in the vector
scale(data, scale= FALSE )

      [,1]
 [1,] -10
 [2,] -8
 [3,] -5
 [4,] -1
 [5,] 0
 [6,] 3
 [7,] 4
 [8,] 5
 [9,] 5
[10,] 7

attr(,"scaled:center")
[1] 14

ရလဒ်တန်ဖိုးများသည် dataset ၏ဗဟိုချက်တန်ဖိုးများဖြစ်သည်။ scale() function သည် dataset ၏ပျမ်းမျှတန်ဖိုးသည် 14 ဖြစ်သည်ကိုပြောပြသည်။

ပုံမှန်အားဖြင့် စကေး() လုပ်ဆောင်ချက်သည် တစ်ဦးချင်းစီ စူးစမ်းလေ့လာမှုတစ်ခုစီမှ ဆိုလိုချက်ကို နုတ်ပြီး စံသွေဖည်မှုဖြင့် ပိုင်းခြားကြောင်း သတိပြုပါ။

scale=FALSE ကို သတ်မှတ်ခြင်းဖြင့် ကျွန်ုပ်တို့ R ကို စံသွေဖည်မှုဖြင့် မခွဲရန် ပြောပါသည်။

ဥပမာ 2- ဒေတာဘောင်ရှိ ကော်လံများကို အလယ်ဗဟို

အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခုစီ၏ ကော်လံတစ်ခုစီ၏ တန်ဖိုးများကို ဗဟိုပြုရန် sapply() လုပ်ဆောင်ချက်နှင့် R ဒေတာဘေ့စ်၏ Scale() လုပ်ဆောင်ချက်ကို ပြသသည်-

 #create data frame
df <- data.frame(x = c(1, 4, 5, 6, 6, 8, 9),
                 y = c(7, 7, 8, 8, 8, 9, 12),
                 z = c(3, 3, 4, 4, 6, 7, 7))

#center each column in the data frame
df_new <- sapply(df, function (x) scale(x, scale= FALSE ))

#display data frame
df_new

              X Y Z
[1,] -4.5714286 -1.4285714 -1.8571429
[2,] -1.5714286 -1.4285714 -1.8571429
[3,] -0.5714286 -0.4285714 -0.8571429
[4,] 0.4285714 -0.4285714 -0.8571429
[5,] 0.4285714 -0.4285714 1.1428571
[6,] 2.4285714 0.5714286 2.1428571
[7,] 3.4285714 3.5714286 2.1428571

colMeans() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာဘောင်အသစ်ရှိ ကော်လံတစ်ခုစီ၏ ပျမ်းမျှအား သုညဖြစ်ကြောင်း စစ်ဆေးနိုင်သည်-

 colMeans(df_new)

            xyz 2.537653e-16 -2.537653e-16 3.806479e-16 

တန်ဖိုးများကို သိပ္ပံနည်းကျမှတ်စုတွင် ပြထားသော်လည်း တန်ဖိုးတစ်ခုစီသည် မရှိမဖြစ်အားဖြင့် သုညဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ကော်လံများထက် ပျမ်းမျှနည်း
R တွင် သီးခြားကော်လံများကို ပေါင်းနည်း
R ရှိ ကော်လံများစွာမှ အစွန်းများကို ဖယ်ရှားနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်