R တွင် histogram breaks ကို သတ်မှတ်နည်း (ဥပမာများဖြင့်)


မူရင်းအားဖြင့်၊ R ရှိ hist() လုပ်ဆောင်ချက်သည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရမည့် bins အရေအတွက်ကို ဆုံးဖြတ်ရန် Sturges ၏ စည်းမျဉ်းကို အသုံးပြုသည်။

Sturges ၏စည်းမျဉ်းသည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ကို ဆုံးဖြတ်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုသည်-

အကောင်းဆုံးပုံးများ = ⌈log 2 n + 1⌉

ရွှေ-

  • n- ဒေတာအတွဲတွင် ကြည့်ရှုမှု စုစုပေါင်း။
  • ⌈ ⌉- “ မျက်နှာကျက်” ဟု အဓိပ္ပါယ်ရသော သင်္ကေတများ၊ ဆိုလိုသည်မှာ အနီးဆုံးနံပါတ်တစ်ခုလုံး၏ အဖြေကို ဝိုင်းပတ်သည်။

ဥပမာအားဖြင့်၊ ဒေတာအတွဲတစ်ခုတွင် လေ့လာတွေ့ရှိချက် 31 ခုရှိပါက၊ Sturge ၏စည်းမျဉ်းသည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ကို ဆုံးဖြတ်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုမည်ဖြစ်သည်။

အကောင်းဆုံးပုံးများ = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .

Sturges ၏ စည်းမျဉ်းအရ၊ ဤဒေတာအတွဲကို မြင်သာစေရန် histogram ရှိ အကွက် 6 ခုကို အသုံးပြုသင့်သည်။

R တွင် hist() လုပ်ဆောင်ချက်ကို အသုံးပြုပါက ဟီစတိုဂရမ်တွင် ပြသမည့် bins အရေအတွက်ကို အလိုအလျောက်ရွေးချယ်ရန်အတွက် Sturges ၏ စည်းမျဉ်းကို အသုံးပြုမည်ဖြစ်သည်။

 hist(data)

အသုံးပြုရန် မတူညီသော bins အရေအတွက်ကို သတ်မှတ်ရန် breaks argument ကို အသုံးပြုသော်လည်း R သည် ၎င်းကို အသုံးပြုရန် bins မည်မျှကို “ အကြံပြုချက်” အဖြစ်သာ အသုံးပြုပါမည်။

 hist(data, breaks= 7 )

သို့ရာတွင်၊ သင်သည် ဟီစတိုဂရမ်တစ်ခုရှိ သတ်မှတ်ထားသော အကွက်အရေအတွက်ကို အသုံးပြုရန် R အား ဖိအားပေးရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။

 #create histogram with 7 bins
hist(data, breaks = seq(min(data), max(data), length. out = 8 ))

မှတ်ချက်n သည် သင်အလိုရှိသော bins အရေအတွက်ဖြစ်သည့် length.out အတွက် အလျား n+1 ကို အသုံးပြုရပါမည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤကုဒ်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- R တွင် Histogram Breaks ကို သတ်မှတ်ခြင်း

R တွင် အောက်ပါ data set သည် value 16 ခုရှိသည်ဆိုပါစို့။

 #create vector of 16 values
data <- c(2, 3, 3, 3, 4, 4, 5, 6, 8, 10, 12, 14, 15, 18, 20, 21)

ကျွန်ုပ်တို့သည် hist() လုပ်ဆောင်ချက်ကို အသုံးပြုပါက၊ R သည် အောက်ပါ histogram ကို 5 bins ဖြင့် ဖန်တီးလိမ့်မည်-

 #create histogram
hist(data)

မှတ်ချက် – R အဖွဲ့ 5 ဖွဲ့သည် လေ့လာတွေ့ရှိချက် 16 ခုပါသည့် ဒေတာအတွဲကို မြင်သာစေရန် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ဖြစ်ကြောင်း ဆုံးဖြတ်ရန် R သည် Sturges ၏စည်းမျဉ်းကို အသုံးပြုခဲ့သည်။

Histogram တွင်အသုံးပြုရန်အုပ်စု 7 ခုသတ်မှတ်ရန် breaks argument ကိုအသုံးပြုရန်ကြိုးစားပါက၊ R သည် ၎င်းကို “ အကြံပြုချက်” အဖြစ်သာခံယူပြီး 10 အုပ်စုကိုအသုံးပြုရန်ရွေးချယ်ပါ-

 #attempt to create histogram with 7 bins
hist(data, breaks= 7 ) 

သို့သော်၊ ကျွန်ုပ်တို့သည် ဟီစတိုဂရမ်တွင် R 7 bins ကိုအသုံးပြုရန် အောက်ပါကုဒ်ကိုသုံးနိုင်သည်။

 #create histogram with 7 bins
hist(data, breaks = seq(min(data), max(data), length. out = 8 ))

ရလဒ်သည် အညီအမျှ ခွဲထားသော အကွက် 7 ခုပါသည့် histogram တစ်ခုဖြစ်ကြောင်း သတိပြုပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် နှိုင်းရကြိမ်နှုန်း ဟီစတိုဂရမ် ဖန်တီးနည်း
R တွင် များစွာသော ဟီစတိုဂရမ်များကို မည်သို့ဆွဲမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်