R တွင် z ရမှတ်များ တွက်နည်း


ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ z-score သည် စံနှုန်းတစ်ခုမှ တန်ဖိုးတစ်ခုသွေဖည်မှုမည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်-

z = (X – μ) / σ

ရွှေ-

  • X သည် ဒေတာအကြမ်းတစ်ခုတည်းတန်ဖိုးဖြစ်သည်။
  • µ သည် လူဦးရေကို ဆိုလိုသည်။
  • σ သည် လူဦးရေစံသွေဖည်သည်။

ဤသင်ခန်းစာသည် R တွင် ဒေတာကုန်ကြမ်းတန်ဖိုးများအတွက် z-ရမှတ်များကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။

ဥပမာ 1- Vector တစ်ခုအတွက် Z-ရမှတ်များကို ရှာဖွေခြင်း။

အောက်ပါကုဒ်သည် vector တစ်ခုရှိဒေတာအကြမ်းတစ်ခုစီအတွက် z-score ကိုမည်သို့ရှာဖွေရမည်ကိုပြသသည်-

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

z-score တစ်ခုစီတွင် တစ်ဦးချင်းတန်ဖိုးသည် ပျမ်းမျှထံမှ စံသွေဖည်မှု မည်မျှရှိသည်ကို ပြောပြသည်။ ဥပမာအားဖြင့်:

  • “ 6” ၏ ပထမကုန်ကြမ်းဒေတာတန်ဖိုးသည် ပျမ်းမျှ အောက်ရှိ 1.323 စံသွေဖီသည်။
  • ပဉ္စမအကြမ်းထည်ဒေတာတန်ဖိုး “ 13” သည် 0 စံနှုန်းမှ သွေဖီသည်၊ ဆိုလိုသည်မှာ ၎င်းသည် ဆိုလိုရင်းနှင့် ညီမျှသည်။
  • “ 22” ၏ နောက်ဆုံးကုန်ကြမ်းဒေတာတန်ဖိုးသည် ပျမ်းမျှ အထက် 1.701 စံသွေဖီသည်။

ဥပမာ 2- DataFrame ရှိ ကော်လံတစ်ခုအတွက် Z-Scores ကိုရှာပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခု၏ ကော်လံတစ်ခုတွင် ဒေတာအကြမ်းတန်ဖိုးတစ်ခုစီအတွက် z-score ကို မည်သို့ရှာဖွေရမည်ကို ပြသသည်-

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

z-score တစ်ခုစီတွင် တစ်ဦးချင်းတန်ဖိုးသည် ပျမ်းမျှထံမှ စံသွေဖည်မှု မည်မျှရှိသည်ကို ပြောပြသည်။ ဥပမာအားဖြင့်:

  • “ 24” ၏ ပထမကုန်ကြမ်းဒေတာတန်ဖိုးသည် ပျမ်းမျှ အထက် 0.619 စံသွေဖီသည်။
  • ဒုတိယအကြမ်းထည်ဒေတာတန်ဖိုး “ 29” သည် ပျမ်းမျှ ထက် 1.464 စံသွေဖီသည်။
  • တတိယအကြမ်းထည်ဒေတာတန်ဖိုး “ 13” သည် ဆိုလိုရင်း အောက်တွင် 1.238 စံသွေဖည်သည်။

နောက် … ပြီးတော့။

ဥပမာ 3- DataFrame ရှိ ကော်လံတစ်ခုစီအတွက် Z-ရမှတ်များကို ရှာပါ။

အောက်ပါကုဒ်သည် sapply() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာဘောင်တစ်ခုစီ၏ ကော်လံတစ်ခုစီရှိ ဒေတာအကြမ်းတစ်ခုစီအတွက် z-score ကို မည်သို့ရှာဖွေရမည်ကို ပြသထားသည်။

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

တန်ဖိုးတစ်ခုစီအတွက် z-ရမှတ်များကို ၎င်းတို့တည်ရှိနေသည့် ကော်လံနှင့် နှိုင်းယှဉ်ပြသထားသည်။ ဥပမာအားဖြင့်:

  • ပထမကော်လံရှိ “ 4” ၏ ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ ပျမ်းမျှတန်ဖိုး အောက် 0.923 စံသွေဖည်သည်။
  • ဒုတိယကော်လံရှိ “ 24” ၏ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ပျမ်းမျှတန်ဖိုး အထက် 0.619 စံသွေဖီသည်။
  • တတိယကော်လံရှိ “ 9” ၏ ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ပျမ်းမျှတန်ဖိုးထက် 0.904 စံသွေဖည်မှုများ ဖြစ်သည်

နောက် … ပြီးတော့။

နောက်ထပ် R သင်ခန်းစာများကို ဤနေရာတွင် ရှာနိုင်သည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်