R တွင် deciles တွက်ချက်နည်း (ဥပမာများနှင့်အတူ)


ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ deciles များသည် ကိန်းဂဏန်းများကို ကြိမ်နှုန်းတန်းတူ အုပ်စုဆယ်စုအဖြစ် ပိုင်းခြားထားသော ကိန်းဂဏာန်းများဖြစ်သည်။

ပထမ decile သည် ဒေတာတန်ဖိုးအားလုံး၏ 10% အောက်တွင် ကျရောက်သည့် အမှတ်ဖြစ်သည်။ ဒုတိယ decile သည် ဒေတာတန်ဖိုးများအားလုံး၏ 20% အောက်တွင် ကျရောက်သည့် အမှတ်ဖြစ်သွားပြီဖြစ်သည်။

R တွင် dataset တစ်ခု၏ deciles များကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 quantile(data, probs = seq (.1, .9, by = .1 ))

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- R ဖြင့် decis များကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် တန်ဖိုး 20 ဖြင့် ဒေတာအတွဲအတုကို ဖန်တီးနည်းကို ပြသပြီး ဒေတာအတွဲ၏ decile တန်ဖိုးများကို တွက်ချက်သည်-

 #create dataset
data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
          89, 90, 91, 92, 93, 93, 94, 95, 97, 99)

#calculate deciles of dataset
quantile(data, probs = seq (.1, .9, by = .1 ))

 10% 20% 30% 40% 50% 60% 70% 80% 90% 
63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2 

decis များကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • ဒေတာတန်ဖိုးများအားလုံး၏ 10% သည် 63.4 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 20% သည် 67.8 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 30% သည် 76.5 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 40% သည် 83.6 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 50% သည် 88.5 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 60% သည် 90.4 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 70% သည် 92.3 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 80% သည် 93.2 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 90% သည် 95.2 ထက်နည်းပါသည်။

50th ရာခိုင်နှုန်းရှိ တန်ဖိုးသည် ဒေတာအတွဲ၏ ပျမ်းမျှတန်ဖိုးနှင့် ညီမျှကြောင်း သတိပြုသင့်သည်။

ဥပမာ- R တွင် deciles များတွင် တန်ဖိုးများထည့်ခြင်း။

ဒေတာတန်ဖိုးတစ်ခုစီကို decile တွင်ထားရန်၊ R တွင် dplyr package မှ ntile(x၊ ngroups) လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် ယခင်နမူနာတွင် ကျွန်ုပ်တို့ဖန်တီးခဲ့သည့် ဒေတာအတွဲအတွက် ဤလုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။

 library (dplyr)

#create dataset
data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                            89, 90, 91, 92, 93, 93, 94, 95, 97, 99))

#place each value into a decile
data$decile <- ntile(data, 10)

#viewdata
data

   values decile
1 56 1
2 58 1
3 64 2
4 67 2
5 68 3
6 73 3
7 78 4
8 83 4
9 84 5
10 88 5
11 89 6
12 90 6
13 91 7
14 92 7
15 93 8
16 93 8
17 94 9
18 95 9
19 97 10
20 99 10

ရလဒ်ကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • ဒေတာတန်ဖိုး 56 သည် 0% နှင့် 10% ရာခိုင်နှုန်းကြားတွင် ဖြစ်သောကြောင့် ၎င်းသည် ပထမ Decile တွင်ဖြစ်သည်။
  • ဒေတာတန်ဖိုး 58 သည် 0% နှင့် 10% ရာခိုင်နှုန်းကြားရှိသောကြောင့် ၎င်းသည် ပထမ Decile တွင်ဖြစ်သည်။
  • ဒေတာတန်ဖိုး 64 သည် 10% နှင့် 20% ရာခိုင်နှုန်းကြားရှိသောကြောင့် ၎င်းသည် ဒုတိယ decile ဖြစ်သည်။
  • ဒေတာတန်ဖိုး 67 သည် 10% နှင့် 20% ရာခိုင်နှုန်းကြားရှိသောကြောင့် ၎င်းသည် ဒုတိယ decile ဖြစ်သည်။
  • ဒေတာတန်ဖိုး 68 သည် 20% နှင့် 30% ရာခိုင်နှုန်းကြားတွင် ဖြစ်သောကြောင့် ၎င်းသည် တတိယ decile ဖြစ်သည်။

နောက် … ပြီးတော့။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ရာခိုင်နှုန်းများ တွက်နည်း
R တွင် quartiles တွက်နည်း
R တွင် ကြိမ်နှုန်းဇယားများ ဖန်တီးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်