R တွင် စကေး() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်း (ဥပမာများဖြင့်)


R ရှိ scale() လုပ်ဆောင်ချက်ကို vector၊ matrix သို့မဟုတ် data frame တွင် တန်ဖိုးများကို စကေးသတ်မှတ်ရန် အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-

 scale(x, center = TRUE , scale = TRUE )

ရွှေ-

  • x : စကေးချရန် အရာဝတ္ထုအမည်
  • အလယ် : စကေးချဲ့တဲ့အခါ ပျမ်းမျှကို နုတ်မလား။ မူရင်းမှာ TRUE ဖြစ်သည်။
  • စကေး : အတိုင်းအတာကို တိုင်းတာသောအခါ စံသွေဖည်မှုဖြင့် ပိုင်းခြားခြင်းရှိမရှိ မူရင်းမှာ TRUE ဖြစ်သည်။

ဤလုပ်ဆောင်ချက်သည် အတိုင်းအတာတန်ဖိုးများကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုသည်-

အတိုင်းအတာ x = ( မူရင်း x – x̄) / s

ရွှေ-

  • မူရင်း x : မူရင်း x တန်ဖိုး
  • : နမူနာဆိုလိုသည်။
  • s : နမူနာ၏ စံသွေဖည်မှု

မူရင်းတန်ဖိုးတစ်ခုစီကို z-score အဖြစ်သို့ ပြောင်းလဲပေးသည့် data normalization ဟုလည်း ခေါ်သည်။

အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1: Vector တစ်ခုရှိ စကေးတန်ဖိုးများ

R တွင် အောက်ပါတန်ဖိုးများ ကျွန်ုပ်တို့တွင်ရှိသည်ဆိုပါစို့။

 #define vector of values
x <- c(1, 2, 3, 4, 5, 6, 7, 8, 9)

#view mean and standard deviation of values
mean(x)

[1] 5

sd(x)

[1] 2.738613

အောက်ပါကုဒ်သည် scale() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ vector တန်ဖိုးများကို မည်ကဲ့သို့ အတိုင်းအတာကို ပြသည်-

 #scale the values of x
x_scaled <- scale(x)

#view scaled values
x_scaled

            [,1]
 [1,] -1.4605935
 [2,] -1.0954451
 [3,] -0.7302967
 [4,] -0.3651484
 [5,] 0.0000000
 [6,] 0.3651484
 [7,] 0.7302967
 [8,] 1.0954451
 [9,] 1.4605935

ဤတွင် အတိုင်းအတာတန်ဖိုးတစ်ခုစီကို တွက်ချက်ပုံမှာ-

  • တန်ဖိုး 1- (1 – 5) / 2.738613 = -1.46
  • တန်ဖိုး 2- (2 – 5) / 2.738613 = -1.09
  • တန်ဖိုး 3- (3 – 5) / 2.738613 = -0.73

နောက် … ပြီးတော့။

scale=FALSE ကို ကျွန်ုပ်တို့ သတ်မှတ်ပါက၊ အတိုင်းအတာကို တိုင်းတာသောအခါ စံသွေဖည်မှုဖြင့် လုပ်ဆောင်ချက်သည် ပိုင်းခြားမည်မဟုတ်ကြောင်း သတိပြုပါ။

 #scale the values of x but don't divide by standard deviation
x_scaled <- scale(x, scale = FALSE )

#view scaled values
x_scaled

      [,1]
 [1,] -4
 [2,] -3
 [3,] -2
 [4,] -1
 [5,] 0
 [6,] 1
 [7,] 2
 [8,] 3
 [9,] 4

ဤတွင် အတိုင်းအတာတန်ဖိုးတစ်ခုစီကို တွက်ချက်ပုံမှာ-

  • တန်ဖိုး 1: 1 – 5 = -4
  • တန်ဖိုး 2: 2 – 5 = -3
  • တန်ဖိုး 3:3–5 = -2

နောက် … ပြီးတော့။

ဥပမာ 2: ဒေတာဘောင်တစ်ခုရှိ ကော်လံတန်ဖိုးများကို စကေးချပါ။

အများစုမှာ၊ ကော်လံတစ်ခုစီတွင် ပျမ်းမျှ 0 နှင့် 1 စံသွေဖည်မှုရှိသော ဒေတာဘောင်တစ်ခုရှိ ကော်လံအများအပြား၏ တန်ဖိုးများကို တိုင်းတာလိုသောအခါတွင် ကျွန်ုပ်တို့သည် scale() လုပ်ဆောင်ချက်ကို အသုံးပြုပါသည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် R တွင် အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (x=c(1, 2, 3, 4, 5, 6, 7, 8, 9),
                 y=c(10, 20, 30, 40, 50, 60, 70, 80, 90))

#view data frame
df

  xy
1 1 10
2 2 20
3 3 30
4 4 40
5 5 50
6 6 60
7 7 70
8 8 80
9 9 90

y variable ၏တန်ဖိုးများအကွာအဝေးသည် x variable ၏တန်ဖိုးများအကွာအဝေးထက်များစွာပိုကြီးသည်ကို သတိပြုပါ။

x နှင့် y နှစ်ခုစလုံး၏ အတိုင်းအတာတန်ဖိုးများသည် 0 နှင့် 1 ၏ စံသွေဖည်မှုရှိကြောင်း ကော်လံနှစ်ခုရှိ တန်ဖိုးများကို အတိုင်းအတာအတွက် scale() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။

 #scale values in each column of data frame
df_scaled <- scale(df)

#view scaled data frame
df_scaled

               xy
 [1,] -1.4605935 -1.4605935
 [2,] -1.0954451 -1.0954451
 [3,] -0.7302967 -0.7302967
 [4,] -0.3651484 -0.3651484
 [5,] 0.0000000 0.0000000
 [6,] 0.3651484 0.3651484
 [7,] 0.7302967 0.7302967
 [8,] 1.0954451 1.0954451
 [9,] 1.4605935 1.4605935

ယခု x နှင့် y ကော်လံများတွင် ပျမ်းမျှ 0 ရှိပြီး 1 ၏ စံသွေဖည်မှုရှိသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင်ဒေတာကိုပုံမှန်ဖြစ်အောင်လုပ်နည်း
R တွင်ဒေတာစံနှုန်းသတ်မှတ်နည်း
R တွင် ကော်လံများထက် ပျမ်းမျှနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်