R တွင် ဂဏန်းငါးလုံး၏ အကျဉ်းချုပ်ကို တွက်ချက်နည်း (ဥပမာများဖြင့်)
ဂဏန်းငါးလုံးအနှစ်ချုပ် သည် အောက်ပါတန်ဖိုးငါးခုကို အသုံးပြု၍ ဒေတာအစုတစ်စုကို အကျဉ်းချုပ်ဖော်ပြသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။
- အနိမ့်ဆုံး
- ပထမလေးပုံတစ်ပုံ
- ပျမ်းမျှ
- တတိယလေးပုံတစ်ပုံ
- အများဆုံး
ဂဏန်းငါးလုံးအကျဉ်းချုပ်သည် ဒေတာဖြန့်ဝေမှု၏ အကျဉ်းချုပ်ကို အောက်ပါအတိုင်း ပံ့ပိုးပေးသောကြောင့် အသုံးဝင်ပါသည်။
- ၎င်းသည် မီဒီယမ်ကို အသုံးပြု၍ အလယ်တန်းတန်ဖိုးသည် မည်သည့်နေရာတွင် ရှိနေသည်ကို ပြောပြသည်။
- ပထမနှင့်တတိယ quartiles ကိုအသုံးပြု၍ ဒေတာဖြန့်ဝေမှုကိုပြောပြသည်။
- ၎င်းသည် အနိမ့်ဆုံးနှင့် အမြင့်ဆုံးကို အသုံးပြု၍ ဒေတာ၏ အကွာအဝေးကို ပြောပြသည်။
R ရှိ ဒေတာအတွဲတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တွက်ချက်ရန် အရိုးရှင်းဆုံးနည်းလမ်းမှာ R အခြေခံမှ fivenum() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။
fivenum(data)
အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။
ဥပမာ 1- vector တစ်ခု၏ နံပါတ်ငါးခု အကျဉ်းချုပ်
အောက်ပါကုဒ်သည် R တွင် ကိန်းဂဏာန်း vector တစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တွက်ချက်နည်းကို ပြသည်-
#define numeric vector data <- c(4, 6, 6, 7, 8, 9, 12, 13, 14, 15, 15, 18, 22) #calculate five number summary of data fivenum(data) [1] 4 7 12 15 22
ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-
- အနည်းဆုံး: 4
- ပထမ quartile: 7
- ပျမ်းမျှ: 12
- တတိယအကြိမ် 15
- အများဆုံး- ၂၂
ကွက်လပ်တစ်ခုကို ဖန်တီးခြင်းဖြင့် ဂဏန်းငါးလုံးအနှစ်ချုပ်ကို ကျွန်ုပ်တို့ လျင်မြန်စွာ မြင်ယောင်နိုင်သည်-
boxplot(data) [1] 4 7 12 15 22

ဤတွင် boxplot ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- ဂရပ်၏အောက်ခြေရှိ စာကြောင်းသည် အနိမ့်ဆုံးတန်ဖိုး ( 4 ) ကို ကိုယ်စားပြုသည်။
- အကွက်အောက်ခြေရှိ စာကြောင်းသည် ပထမ quartile ( 7 ) ကို ကိုယ်စားပြုသည်။
- အကွက်အလယ်ရှိ စာကြောင်းသည် အလယ်အလတ် ( 12 ) ကို ကိုယ်စားပြုသည်။
- အကွက်၏ ထိပ်ရှိ စာကြောင်းသည် တတိယ quartile ( 15 ) ကို ကိုယ်စားပြုသည်။
- ဂရပ်၏ထိပ်ရှိ စာကြောင်းသည် အများဆုံးတန်ဖိုး ( 22 ) ကို ကိုယ်စားပြုသည်။
ဥပမာ 2- ဒေတာဘောင်ရှိ ကော်လံတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်
အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခုရှိ ကော်လံတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တွက်ချက်နည်းကို ပြသသည်-
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'), points=c(99, 90, 86, 88, 95, 87, 85, 89), assists=c(33, 28, 31, 39, 34, 30, 29, 25), rebounds=c(30, 28, 24, 24, 28, 30, 31, 35)) #calculate five number summary of points column fivenum(df$points) [1] 85.0 86.5 88.5 92.5 99.0
ဥပမာ 3- ကော်လံအများအပြား၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်
အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခုရှိ ကော်လံအများအပြား၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တစ်ပြိုင်နက်တွက်ချက်ရန် sapply() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'), points=c(99, 90, 86, 88, 95, 87, 85, 89), assists=c(33, 28, 31, 39, 34, 30, 29, 25), rebounds=c(30, 28, 24, 24, 28, 30, 31, 35)) #calculate five number summary of points, assists, and rebounds column sapply(df[c(' points ', ' assists ', ' rebounds ')], fivenum) points assists rebounds [1,] 85.0 25.0 24.0 [2,] 86.5 28.5 26.0 [3,] 88.5 30.5 29.0 [4,] 92.5 33.5 30.5 [5,] 99.0 39.0 35.0
သက်ဆိုင်ရာ- R တွင် apply(), lapply(), sapply(), နှင့် tapply() လမ်းညွှန်
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် အနှစ်ချုပ်ဇယားများ ဖန်တီးနည်း
R တွင် အကွာအဝေးကို မည်သို့ရှာရမည်နည်း။
R တွင် outliers ကိုမည်သို့ဖယ်ရှားရမည်နည်း