R တွင် ဂဏန်းငါးလုံး၏ အကျဉ်းချုပ်ကို တွက်ချက်နည်း (ဥပမာများဖြင့်)


ဂဏန်းငါးလုံးအနှစ်ချုပ် သည် အောက်ပါတန်ဖိုးငါးခုကို အသုံးပြု၍ ဒေတာအစုတစ်စုကို အကျဉ်းချုပ်ဖော်ပြသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။

  • အနိမ့်ဆုံး
  • ပထမလေးပုံတစ်ပုံ
  • ပျမ်းမျှ
  • တတိယလေးပုံတစ်ပုံ
  • အများဆုံး

ဂဏန်းငါးလုံးအကျဉ်းချုပ်သည် ဒေတာဖြန့်ဝေမှု၏ အကျဉ်းချုပ်ကို အောက်ပါအတိုင်း ပံ့ပိုးပေးသောကြောင့် အသုံးဝင်ပါသည်။

  • ၎င်းသည် မီဒီယမ်ကို အသုံးပြု၍ အလယ်တန်းတန်ဖိုးသည် မည်သည့်နေရာတွင် ရှိနေသည်ကို ပြောပြသည်။
  • ပထမနှင့်တတိယ quartiles ကိုအသုံးပြု၍ ဒေတာဖြန့်ဝေမှုကိုပြောပြသည်။
  • ၎င်းသည် အနိမ့်ဆုံးနှင့် အမြင့်ဆုံးကို အသုံးပြု၍ ဒေတာ၏ အကွာအဝေးကို ပြောပြသည်။

R ရှိ ဒေတာအတွဲတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တွက်ချက်ရန် အရိုးရှင်းဆုံးနည်းလမ်းမှာ R အခြေခံမှ fivenum() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။

 fivenum(data)

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ 1- vector တစ်ခု၏ နံပါတ်ငါးခု အကျဉ်းချုပ်

အောက်ပါကုဒ်သည် R တွင် ကိန်းဂဏာန်း vector တစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တွက်ချက်နည်းကို ပြသည်-

 #define numeric vector
data <- c(4, 6, 6, 7, 8, 9, 12, 13, 14, 15, 15, 18, 22)

#calculate five number summary of data
fivenum(data)

[1] 4 7 12 15 22

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • အနည်းဆုံး: 4
  • ပထမ quartile: 7
  • ပျမ်းမျှ: 12
  • တတိယအကြိမ် 15
  • အများဆုံး- ၂၂

ကွက်လပ်တစ်ခုကို ဖန်တီးခြင်းဖြင့် ဂဏန်းငါးလုံးအနှစ်ချုပ်ကို ကျွန်ုပ်တို့ လျင်မြန်စွာ မြင်ယောင်နိုင်သည်-

 boxplot(data)

[1] 4 7 12 15 22 

ဤတွင် boxplot ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • ဂရပ်၏အောက်ခြေရှိ စာကြောင်းသည် အနိမ့်ဆုံးတန်ဖိုး ( 4 ) ကို ကိုယ်စားပြုသည်။
  • အကွက်အောက်ခြေရှိ စာကြောင်းသည် ပထမ quartile ( 7 ) ကို ကိုယ်စားပြုသည်။
  • အကွက်အလယ်ရှိ စာကြောင်းသည် အလယ်အလတ် ( 12 ) ကို ကိုယ်စားပြုသည်။
  • အကွက်၏ ထိပ်ရှိ စာကြောင်းသည် တတိယ quartile ( 15 ) ကို ကိုယ်စားပြုသည်။
  • ဂရပ်၏ထိပ်ရှိ စာကြောင်းသည် အများဆုံးတန်ဖိုး ( 22 ) ကို ကိုယ်စားပြုသည်။

ဥပမာ 2- ဒေတာဘောင်ရှိ ကော်လံတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်

အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခုရှိ ကော်လံတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တွက်ချက်နည်းကို ပြသသည်-

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points column
fivenum(df$points)

[1] 85.0 86.5 88.5 92.5 99.0

ဥပမာ 3- ကော်လံအများအပြား၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်

အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခုရှိ ကော်လံအများအပြား၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို တစ်ပြိုင်နက်တွက်ချက်ရန် sapply() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points, assists, and rebounds column
sapply(df[c(' points ', ' assists ', ' rebounds ')], fivenum)

     points assists rebounds
[1,] 85.0 25.0 24.0
[2,] 86.5 28.5 26.0
[3,] 88.5 30.5 29.0
[4,] 92.5 33.5 30.5
[5,] 99.0 39.0 35.0

သက်ဆိုင်ရာ- R တွင် apply(), lapply(), sapply(), နှင့် tapply() လမ်းညွှန်

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် အနှစ်ချုပ်ဇယားများ ဖန်တီးနည်း
R တွင် အကွာအဝေးကို မည်သို့ရှာရမည်နည်း။
R တွင် outliers ကိုမည်သို့ဖယ်ရှားရမည်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်