R တွင် z ရမှတ်များ တွက်နည်း
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ z-score သည် စံနှုန်းတစ်ခုမှ တန်ဖိုးတစ်ခုသွေဖည်မှုမည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်-
z = (X – μ) / σ
ရွှေ-
- X သည် ဒေတာအကြမ်းတစ်ခုတည်းတန်ဖိုးဖြစ်သည်။
- µ သည် လူဦးရေကို ဆိုလိုသည်။
- σ သည် လူဦးရေစံသွေဖည်သည်။
ဤသင်ခန်းစာသည် R တွင် ဒေတာကုန်ကြမ်းတန်ဖိုးများအတွက် z-ရမှတ်များကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။
ဥပမာ 1- Vector တစ်ခုအတွက် Z-ရမှတ်များကို ရှာဖွေခြင်း။
အောက်ပါကုဒ်သည် vector တစ်ခုရှိဒေတာအကြမ်းတစ်ခုစီအတွက် z-score ကိုမည်သို့ရှာဖွေရမည်ကိုပြသသည်-
#create vector of data data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22) #find z-score for each data value z_scores <- (data-mean(data))/sd(data) #display z-scores z_scores [1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000 [7] 0.3779645 0.5669467 1.1338934 1.7008401
z-score တစ်ခုစီတွင် တစ်ဦးချင်းတန်ဖိုးသည် ပျမ်းမျှထံမှ စံသွေဖည်မှု မည်မျှရှိသည်ကို ပြောပြသည်။ ဥပမာအားဖြင့်:
- “ 6” ၏ ပထမကုန်ကြမ်းဒေတာတန်ဖိုးသည် ပျမ်းမျှ အောက်ရှိ 1.323 စံသွေဖီသည်။
- ပဉ္စမအကြမ်းထည်ဒေတာတန်ဖိုး “ 13” သည် 0 စံနှုန်းမှ သွေဖီသည်၊ ဆိုလိုသည်မှာ ၎င်းသည် ဆိုလိုရင်းနှင့် ညီမျှသည်။
- “ 22” ၏ နောက်ဆုံးကုန်ကြမ်းဒေတာတန်ဖိုးသည် ပျမ်းမျှ အထက် 1.701 စံသွေဖီသည်။
ဥပမာ 2- DataFrame ရှိ ကော်လံတစ်ခုအတွက် Z-Scores ကိုရှာပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခု၏ ကော်လံတစ်ခုတွင် ဒေတာအကြမ်းတန်ဖိုးတစ်ခုစီအတွက် z-score ကို မည်သို့ရှာဖွေရမည်ကို ပြသသည်-
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-score for each data value in the 'points' column z_scores <- (df$points-mean(df$points))/sd(df$points) #display z-scores z_scores [1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502
z-score တစ်ခုစီတွင် တစ်ဦးချင်းတန်ဖိုးသည် ပျမ်းမျှထံမှ စံသွေဖည်မှု မည်မျှရှိသည်ကို ပြောပြသည်။ ဥပမာအားဖြင့်:
- “ 24” ၏ ပထမကုန်ကြမ်းဒေတာတန်ဖိုးသည် ပျမ်းမျှ အထက် 0.619 စံသွေဖီသည်။
- ဒုတိယအကြမ်းထည်ဒေတာတန်ဖိုး “ 29” သည် ပျမ်းမျှ ထက် 1.464 စံသွေဖီသည်။
- တတိယအကြမ်းထည်ဒေတာတန်ဖိုး “ 13” သည် ဆိုလိုရင်း အောက်တွင် 1.238 စံသွေဖည်သည်။
နောက် … ပြီးတော့။
ဥပမာ 3- DataFrame ရှိ ကော်လံတစ်ခုစီအတွက် Z-ရမှတ်များကို ရှာပါ။
အောက်ပါကုဒ်သည် sapply() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာဘောင်တစ်ခုစီ၏ ကော်လံတစ်ခုစီရှိ ဒေတာအကြမ်းတစ်ခုစီအတွက် z-score ကို မည်သို့ရှာဖွေရမည်ကို ပြသထားသည်။
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-scores of each column sapply(df, function(df) (df-mean(df))/sd(df)) assists points rebounds [1,] -0.92315712 0.6191904 -0.9035079 [2,] -0.92315712 1.4635409 -0.9035079 [3,] -0.34011052 -1.2383807 -0.4517540 [4,] -0.04858722 -0.9006405 -0.2258770 [5,] 0.53445939 -0.2251601 1.1293849 [6,] 1.70055260 0.2814502 1.3552619
တန်ဖိုးတစ်ခုစီအတွက် z-ရမှတ်များကို ၎င်းတို့တည်ရှိနေသည့် ကော်လံနှင့် နှိုင်းယှဉ်ပြသထားသည်။ ဥပမာအားဖြင့်:
- ပထမကော်လံရှိ “ 4” ၏ ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ ပျမ်းမျှတန်ဖိုး အောက် 0.923 စံသွေဖည်သည်။
- ဒုတိယကော်လံရှိ “ 24” ၏ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ပျမ်းမျှတန်ဖိုး အထက် 0.619 စံသွေဖီသည်။
- တတိယကော်လံရှိ “ 9” ၏ ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ပျမ်းမျှတန်ဖိုးထက် 0.904 စံသွေဖည်မှုများ ဖြစ်သည် ။
နောက် … ပြီးတော့။
နောက်ထပ် R သင်ခန်းစာများကို ဤနေရာတွင် ရှာနိုင်သည်။