R တွင် histogram breaks ကို သတ်မှတ်နည်း (ဥပမာများဖြင့်)
မူရင်းအားဖြင့်၊ R ရှိ hist() လုပ်ဆောင်ချက်သည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရမည့် bins အရေအတွက်ကို ဆုံးဖြတ်ရန် Sturges ၏ စည်းမျဉ်းကို အသုံးပြုသည်။
Sturges ၏စည်းမျဉ်းသည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ကို ဆုံးဖြတ်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုသည်-
အကောင်းဆုံးပုံးများ = ⌈log 2 n + 1⌉
ရွှေ-
- n- ဒေတာအတွဲတွင် ကြည့်ရှုမှု စုစုပေါင်း။
- ⌈ ⌉- “ မျက်နှာကျက်” ဟု အဓိပ္ပါယ်ရသော သင်္ကေတများ၊ ဆိုလိုသည်မှာ အနီးဆုံးနံပါတ်တစ်ခုလုံး၏ အဖြေကို ဝိုင်းပတ်သည်။
ဥပမာအားဖြင့်၊ ဒေတာအတွဲတစ်ခုတွင် လေ့လာတွေ့ရှိချက် 31 ခုရှိပါက၊ Sturge ၏စည်းမျဉ်းသည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ကို ဆုံးဖြတ်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုမည်ဖြစ်သည်။
အကောင်းဆုံးပုံးများ = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .
Sturges ၏ စည်းမျဉ်းအရ၊ ဤဒေတာအတွဲကို မြင်သာစေရန် histogram ရှိ အကွက် 6 ခုကို အသုံးပြုသင့်သည်။
R တွင် hist() လုပ်ဆောင်ချက်ကို အသုံးပြုပါက ဟီစတိုဂရမ်တွင် ပြသမည့် bins အရေအတွက်ကို အလိုအလျောက်ရွေးချယ်ရန်အတွက် Sturges ၏ စည်းမျဉ်းကို အသုံးပြုမည်ဖြစ်သည်။
hist(data)
အသုံးပြုရန် မတူညီသော bins အရေအတွက်ကို သတ်မှတ်ရန် breaks argument ကို အသုံးပြုသော်လည်း R သည် ၎င်းကို အသုံးပြုရန် bins မည်မျှကို “ အကြံပြုချက်” အဖြစ်သာ အသုံးပြုပါမည်။
hist(data, breaks= 7 )
သို့ရာတွင်၊ သင်သည် ဟီစတိုဂရမ်တစ်ခုရှိ သတ်မှတ်ထားသော အကွက်အရေအတွက်ကို အသုံးပြုရန် R အား ဖိအားပေးရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။
#create histogram with 7 bins hist(data, breaks = seq(min(data), max(data), length. out = 8 ))
မှတ်ချက် – n သည် သင်အလိုရှိသော bins အရေအတွက်ဖြစ်သည့် length.out အတွက် အလျား n+1 ကို အသုံးပြုရပါမည်။
အောက်ဖော်ပြပါ ဥပမာသည် ဤကုဒ်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ- R တွင် Histogram Breaks ကို သတ်မှတ်ခြင်း
R တွင် အောက်ပါ data set သည် value 16 ခုရှိသည်ဆိုပါစို့။
#create vector of 16 values
data <- c(2, 3, 3, 3, 4, 4, 5, 6, 8, 10, 12, 14, 15, 18, 20, 21)
ကျွန်ုပ်တို့သည် hist() လုပ်ဆောင်ချက်ကို အသုံးပြုပါက၊ R သည် အောက်ပါ histogram ကို 5 bins ဖြင့် ဖန်တီးလိမ့်မည်-
#create histogram
hist(data)
မှတ်ချက် – R အဖွဲ့ 5 ဖွဲ့သည် လေ့လာတွေ့ရှိချက် 16 ခုပါသည့် ဒေတာအတွဲကို မြင်သာစေရန် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ဖြစ်ကြောင်း ဆုံးဖြတ်ရန် R သည် Sturges ၏စည်းမျဉ်းကို အသုံးပြုခဲ့သည်။
Histogram တွင်အသုံးပြုရန်အုပ်စု 7 ခုသတ်မှတ်ရန် breaks argument ကိုအသုံးပြုရန်ကြိုးစားပါက၊ R သည် ၎င်းကို “ အကြံပြုချက်” အဖြစ်သာခံယူပြီး 10 အုပ်စုကိုအသုံးပြုရန်ရွေးချယ်ပါ-
#attempt to create histogram with 7 bins
hist(data, breaks= 7 )
သို့သော်၊ ကျွန်ုပ်တို့သည် ဟီစတိုဂရမ်တွင် R 7 bins ကိုအသုံးပြုရန် အောက်ပါကုဒ်ကိုသုံးနိုင်သည်။
#create histogram with 7 bins
hist(data, breaks = seq(min(data), max(data), length. out = 8 ))
ရလဒ်သည် အညီအမျှ ခွဲထားသော အကွက် 7 ခုပါသည့် histogram တစ်ခုဖြစ်ကြောင်း သတိပြုပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် နှိုင်းရကြိမ်နှုန်း ဟီစတိုဂရမ် ဖန်တီးနည်း
R တွင် များစွာသော ဟီစတိုဂရမ်များကို မည်သို့ဆွဲမည်နည်း။