R တွင် quantile() function ကိုအသုံးပြုနည်း
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ ပမာဏများသည် အမျိုးအစားခွဲထားသောဒေတာကို တန်းတူအုပ်စုများအဖြစ် ပိုင်းခြားထားသော တန်ဖိုးများဖြစ်သည်။
ဒေတာအစုံ၏နမူနာအရေအတွက်ကို တွက်ချက်ရန် R ရှိ quantile() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-
quantile(x၊ probs = seq(0၊ 1၊ 0.25)၊ na.rm = FALSE)
ရွှေ-
- x : Vector အမည်
- probs : ဖြစ်နိုင်ခြေများ၏ ကိန်းဂဏာန်း ကွက်လပ်
- na.rm : NA တန်ဖိုးများကို ဖယ်ရှားမလား။
အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ 1- vector တစ်ခု၏ အရေအတွက်ကို တွက်ချက်ပါ။
အောက်ပါကုဒ်သည် R တွင် vector တစ်ခု၏ အရေအတွက်ကို တွက်ချက်နည်းကို ပြသည်-
#define vector of data data = c(1, 3, 3, 4, 5, 7, 8, 9, 12, 13, 13, 15, 18, 20, 22, 23, 24, 28) #calculate quartiles quantile(data, probs = seq(0, 1, 1/4)) 0% 25% 50% 75% 100% 1.0 5.5 12.5 19.5 28.0 #calculate quintiles quantile(data, probs = seq(0, 1, 1/5)) 0% 20% 40% 60% 80% 100% 1.0 4.4 8.8 13.4 21.2 28.0 #calculate deciles quantile(data, probs = seq(0, 1, 1/10)) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 1.0 3.0 4.4 7.1 8.8 12.5 13.4 17.7 21.2 23.3 28.0 #calculate random quantiles of interest quantile(data, probs = c(.2, .5, .9)) 20% 50% 90% 4.4 12.5 23.3
ဥပမာ 2- ဒေတာဘောင်ရှိ ကော်လံအရေအတွက်ကို တွက်ချက်ပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခုရှိ ကော်လံတစ်ခုအတွက် အရေအတွက်ပမာဏကို တွက်ချက်နည်းကို ပြသသည်-
#create data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5, 7, 7, 8, 12, 14, 18),
var2=c(7, 7, 8, 3, 2, 6, 8, 9, 11, 11, 16),
var3=c(3, 3, 6, 6, 8, 4, 4, 7, 10, 10, 11))
#calculate quartiles of column 'var2'
quantile(df$var2, probs = seq(0, 1, 1/4))
0% 25% 50% 75% 100%
2.0 6.5 8.0 10.0 16.0
ကော်လံများစွာအတွက် quantiles များကို တစ်ပြိုင်နက် တွက်ချက်ရန် sapply() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်သည်။
#calculate quartiles of every column
sapply(df, function (x) quantile(x, probs = seq(0, 1, 1/4)))
var1 var2 var3
0% 1.0 2.0 3
25% 3.5 6.5 4
50% 7.0 8.0 6
75% 10.0 10.0 9
100% 18.0 16.0 11
ဥပမာ 3- အုပ်စုအလိုက် အရေအတွက်ကို တွက်ချက်ပါ။
အောက်ပါကုဒ်သည် အုပ်စုဖွဲ့ကိန်းရှင်ဖြင့် အရေအတွက်များကို တွက်ချက်ရန် dplyr ပက်ကေ့ဂျ်ရှိ လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
library (dplyr)
#define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C') ,
points=c(1, 3, 3, 4, 5, 7, 7, 8, 12, 14, 18))
#define quantiles of interest
q = c(.25, .5, .75)
#calculate quantiles by grouping variable
df %>%
group_by(team) %>%
summarize(quant25 = quantile(points, probs = q[1]),
quant50 = quantile(points, probs = q[2]),
quant75 = quantile(points, probs = q[3]))
# A tibble: 3 x 4
team quant25 quant50 quant75
1 to 2.5 3 3.25
2 B 6.5 7 7.25
3 C 13 14 16
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများတွင် အခြားဘုံကိန်းဂဏန်းတန်ဖိုးများကို တွက်ချက်ရန် quantile() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-
R တွင် ရာခိုင်နှုန်းများ တွက်နည်း
R တွင် decciles တွက်ချက်နည်း
R တွင် quartiles တွက်နည်း