R တွင် စကေး() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်း (ဥပမာများဖြင့်)
R ရှိ scale() လုပ်ဆောင်ချက်ကို vector၊ matrix သို့မဟုတ် data frame တွင် တန်ဖိုးများကို စကေးသတ်မှတ်ရန် အသုံးပြုနိုင်သည်။
ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-
scale(x, center = TRUE , scale = TRUE )
ရွှေ-
- x : စကေးချရန် အရာဝတ္ထုအမည်
- အလယ် : စကေးချဲ့တဲ့အခါ ပျမ်းမျှကို နုတ်မလား။ မူရင်းမှာ TRUE ဖြစ်သည်။
- စကေး : အတိုင်းအတာကို တိုင်းတာသောအခါ စံသွေဖည်မှုဖြင့် ပိုင်းခြားခြင်းရှိမရှိ မူရင်းမှာ TRUE ဖြစ်သည်။
ဤလုပ်ဆောင်ချက်သည် အတိုင်းအတာတန်ဖိုးများကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုသည်-
အတိုင်းအတာ x = ( မူရင်း x – x̄) / s
ရွှေ-
- မူရင်း x : မူရင်း x တန်ဖိုး
- x̄ : နမူနာဆိုလိုသည်။
- s : နမူနာ၏ စံသွေဖည်မှု
မူရင်းတန်ဖိုးတစ်ခုစီကို z-score အဖြစ်သို့ ပြောင်းလဲပေးသည့် data normalization ဟုလည်း ခေါ်သည်။
အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ 1: Vector တစ်ခုရှိ စကေးတန်ဖိုးများ
R တွင် အောက်ပါတန်ဖိုးများ ကျွန်ုပ်တို့တွင်ရှိသည်ဆိုပါစို့။
#define vector of values x <- c(1, 2, 3, 4, 5, 6, 7, 8, 9) #view mean and standard deviation of values mean(x) [1] 5 sd(x) [1] 2.738613
အောက်ပါကုဒ်သည် scale() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ vector တန်ဖိုးများကို မည်ကဲ့သို့ အတိုင်းအတာကို ပြသည်-
#scale the values of x x_scaled <- scale(x) #view scaled values x_scaled [,1] [1,] -1.4605935 [2,] -1.0954451 [3,] -0.7302967 [4,] -0.3651484 [5,] 0.0000000 [6,] 0.3651484 [7,] 0.7302967 [8,] 1.0954451 [9,] 1.4605935
ဤတွင် အတိုင်းအတာတန်ဖိုးတစ်ခုစီကို တွက်ချက်ပုံမှာ-
- တန်ဖိုး 1- (1 – 5) / 2.738613 = -1.46
- တန်ဖိုး 2- (2 – 5) / 2.738613 = -1.09
- တန်ဖိုး 3- (3 – 5) / 2.738613 = -0.73
နောက် … ပြီးတော့။
scale=FALSE ကို ကျွန်ုပ်တို့ သတ်မှတ်ပါက၊ အတိုင်းအတာကို တိုင်းတာသောအခါ စံသွေဖည်မှုဖြင့် လုပ်ဆောင်ချက်သည် ပိုင်းခြားမည်မဟုတ်ကြောင်း သတိပြုပါ။
#scale the values of x but don't divide by standard deviation x_scaled <- scale(x, scale = FALSE ) #view scaled values x_scaled [,1] [1,] -4 [2,] -3 [3,] -2 [4,] -1 [5,] 0 [6,] 1 [7,] 2 [8,] 3 [9,] 4
ဤတွင် အတိုင်းအတာတန်ဖိုးတစ်ခုစီကို တွက်ချက်ပုံမှာ-
- တန်ဖိုး 1: 1 – 5 = -4
- တန်ဖိုး 2: 2 – 5 = -3
- တန်ဖိုး 3:3–5 = -2
နောက် … ပြီးတော့။
ဥပမာ 2: ဒေတာဘောင်တစ်ခုရှိ ကော်လံတန်ဖိုးများကို စကေးချပါ။
အများစုမှာ၊ ကော်လံတစ်ခုစီတွင် ပျမ်းမျှ 0 နှင့် 1 စံသွေဖည်မှုရှိသော ဒေတာဘောင်တစ်ခုရှိ ကော်လံအများအပြား၏ တန်ဖိုးများကို တိုင်းတာလိုသောအခါတွင် ကျွန်ုပ်တို့သည် scale() လုပ်ဆောင်ချက်ကို အသုံးပြုပါသည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် R တွင် အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။
#create data frame df <- data. frame (x=c(1, 2, 3, 4, 5, 6, 7, 8, 9), y=c(10, 20, 30, 40, 50, 60, 70, 80, 90)) #view data frame df xy 1 1 10 2 2 20 3 3 30 4 4 40 5 5 50 6 6 60 7 7 70 8 8 80 9 9 90
y variable ၏တန်ဖိုးများအကွာအဝေးသည် x variable ၏တန်ဖိုးများအကွာအဝေးထက်များစွာပိုကြီးသည်ကို သတိပြုပါ။
x နှင့် y နှစ်ခုစလုံး၏ အတိုင်းအတာတန်ဖိုးများသည် 0 နှင့် 1 ၏ စံသွေဖည်မှုရှိကြောင်း ကော်လံနှစ်ခုရှိ တန်ဖိုးများကို အတိုင်းအတာအတွက် scale() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။
#scale values in each column of data frame df_scaled <- scale(df) #view scaled data frame df_scaled xy [1,] -1.4605935 -1.4605935 [2,] -1.0954451 -1.0954451 [3,] -0.7302967 -0.7302967 [4,] -0.3651484 -0.3651484 [5,] 0.0000000 0.0000000 [6,] 0.3651484 0.3651484 [7,] 0.7302967 0.7302967 [8,] 1.0954451 1.0954451 [9,] 1.4605935 1.4605935
ယခု x နှင့် y ကော်လံများတွင် ပျမ်းမျှ 0 ရှိပြီး 1 ၏ စံသွေဖည်မှုရှိသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင်ဒေတာကိုပုံမှန်ဖြစ်အောင်လုပ်နည်း
R တွင်ဒေတာစံနှုန်းသတ်မှတ်နည်း
R တွင် ကော်လံများထက် ပျမ်းမျှနည်း