R တွင် deciles တွက်ချက်နည်း (ဥပမာများနှင့်အတူ)
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ deciles များသည် ကိန်းဂဏန်းများကို ကြိမ်နှုန်းတန်းတူ အုပ်စုဆယ်စုအဖြစ် ပိုင်းခြားထားသော ကိန်းဂဏာန်းများဖြစ်သည်။
ပထမ decile သည် ဒေတာတန်ဖိုးအားလုံး၏ 10% အောက်တွင် ကျရောက်သည့် အမှတ်ဖြစ်သည်။ ဒုတိယ decile သည် ဒေတာတန်ဖိုးများအားလုံး၏ 20% အောက်တွင် ကျရောက်သည့် အမှတ်ဖြစ်သွားပြီဖြစ်သည်။
R တွင် dataset တစ်ခု၏ deciles များကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
quantile(data, probs = seq (.1, .9, by = .1 ))
အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ- R ဖြင့် decis များကို တွက်ချက်ပါ။
အောက်ပါကုဒ်သည် တန်ဖိုး 20 ဖြင့် ဒေတာအတွဲအတုကို ဖန်တီးနည်းကို ပြသပြီး ဒေတာအတွဲ၏ decile တန်ဖိုးများကို တွက်ချက်သည်-
#create dataset data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99) #calculate deciles of dataset quantile(data, probs = seq (.1, .9, by = .1 )) 10% 20% 30% 40% 50% 60% 70% 80% 90% 63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2
decis များကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- ဒေတာတန်ဖိုးများအားလုံး၏ 10% သည် 63.4 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 20% သည် 67.8 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 30% သည် 76.5 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 40% သည် 83.6 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 50% သည် 88.5 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 60% သည် 90.4 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 70% သည် 92.3 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 80% သည် 93.2 ထက်နည်းပါသည်။
- ဒေတာတန်ဖိုးအားလုံး၏ 90% သည် 95.2 ထက်နည်းပါသည်။
50th ရာခိုင်နှုန်းရှိ တန်ဖိုးသည် ဒေတာအတွဲ၏ ပျမ်းမျှတန်ဖိုးနှင့် ညီမျှကြောင်း သတိပြုသင့်သည်။
ဥပမာ- R တွင် deciles များတွင် တန်ဖိုးများထည့်ခြင်း။
ဒေတာတန်ဖိုးတစ်ခုစီကို decile တွင်ထားရန်၊ R တွင် dplyr package မှ ntile(x၊ ngroups) လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
ဤလုပ်ဆောင်ချက်သည် ယခင်နမူနာတွင် ကျွန်ုပ်တို့ဖန်တီးခဲ့သည့် ဒေတာအတွဲအတွက် ဤလုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။
library (dplyr) #create dataset data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99)) #place each value into a decile data$decile <- ntile(data, 10) #viewdata data values decile 1 56 1 2 58 1 3 64 2 4 67 2 5 68 3 6 73 3 7 78 4 8 83 4 9 84 5 10 88 5 11 89 6 12 90 6 13 91 7 14 92 7 15 93 8 16 93 8 17 94 9 18 95 9 19 97 10 20 99 10
ရလဒ်ကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- ဒေတာတန်ဖိုး 56 သည် 0% နှင့် 10% ရာခိုင်နှုန်းကြားတွင် ဖြစ်သောကြောင့် ၎င်းသည် ပထမ Decile တွင်ဖြစ်သည်။
- ဒေတာတန်ဖိုး 58 သည် 0% နှင့် 10% ရာခိုင်နှုန်းကြားရှိသောကြောင့် ၎င်းသည် ပထမ Decile တွင်ဖြစ်သည်။
- ဒေတာတန်ဖိုး 64 သည် 10% နှင့် 20% ရာခိုင်နှုန်းကြားရှိသောကြောင့် ၎င်းသည် ဒုတိယ decile ဖြစ်သည်။
- ဒေတာတန်ဖိုး 67 သည် 10% နှင့် 20% ရာခိုင်နှုန်းကြားရှိသောကြောင့် ၎င်းသည် ဒုတိယ decile ဖြစ်သည်။
- ဒေတာတန်ဖိုး 68 သည် 20% နှင့် 30% ရာခိုင်နှုန်းကြားတွင် ဖြစ်သောကြောင့် ၎င်းသည် တတိယ decile ဖြစ်သည်။
နောက် … ပြီးတော့။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် ရာခိုင်နှုန်းများ တွက်နည်း
R တွင် quartiles တွက်နည်း
R တွင် ကြိမ်နှုန်းဇယားများ ဖန်တီးနည်း