Sturges ဆိုတာဘာလဲ။ ပေတံ? (အဓိပ္ပါယ် & #038; ဥပမာ)
ဟီစတိုဂရမ် တစ်ခုသည် ဒေတာအစုတစ်ခုတွင် တန်ဖိုးများဖြန့်ဝေမှုကို မြင်သာစေရန် ကူညီပေးသည့် ဂရပ်တစ်ခုဖြစ်သည်။
Histogram တွင်အသုံးပြုသော box အရေအတွက်များသည် ဒေတာကိုကျွန်ုပ်တို့ဘာသာပြန်ဆိုပုံအပေါ် ကြီးမားသောအကျိုးသက်ရောက်မှုရှိနိုင်သည်ကိုတွေ့ရှိရပါသည်။
အကယ်၍ ကျွန်ုပ်တို့သည် အုပ်စုများ အလွန်နည်းပါးပါက၊ ဒေတာရှိ စစ်မှန်သော နောက်ခံပုံစံကို ဖျောက်ထားနိုင်သည်-

အကယ်၍ ကျွန်ုပ်တို့သည် အုပ်စုများစွာကို အသုံးပြုပါက၊ ဒေတာအတွဲတစ်ခုတွင် ဆူညံသံကို ရိုးရိုးရှင်းရှင်းမြင်ယောင်နိုင်သည်-

ကံကောင်းထောက်မစွာ၊ ကျွန်ုပ်တို့သည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးသေတ္တာအရေအတွက်ကို ဆုံးဖြတ်ရန် Sturges’ rule ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုနိုင်ပါသည်။
Sturges ၏စည်းမျဉ်းသည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ကို ဆုံးဖြတ်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုသည်-
အကောင်းဆုံးပုံးများ = ⌈log 2 n + 1⌉
ရွှေ-
- n- ဒေတာအတွဲတွင် ကြည့်ရှုမှု စုစုပေါင်း။
- ⌈ ⌉- “ မျက်နှာကျက်” ဟု အဓိပ္ပါယ်ရသော သင်္ကေတများ၊ ဆိုလိုသည်မှာ အနီးဆုံးနံပါတ်တစ်ခုလုံး၏ အဖြေကို ဝိုင်းပတ်သည်။
ဥပမာ- Sturges ၏ စည်းမျဉ်း
ကျွန်ုပ်တို့တွင် n = 31 စောင့်ကြည့်မှု စုစုပေါင်းအောက်ပါဒေတာအတွဲရှိသည်ဆိုပါစို့။

ဤတန်ဖိုးများကို histogram တွင်မြင်ယောင်ရန်အသုံးပြုရန် အကောင်းဆုံးသေတ္တာအရေအတွက်ကို ဆုံးဖြတ်ရန် Sturges ၏စည်းမျဉ်းကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
အကောင်းဆုံးပုံးများ = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .
Sturges ၏စည်းမျဉ်းအရ၊ ဤတန်ဖိုးများကိုမြင်ယောင်ရန်ကျွန်ုပ်တို့အသုံးပြုသည့် histogram တွင် bin 6 ခုကိုအသုံးပြုသင့်သည်။
ဤဒေတာအတွဲအတွက် အုပ်စု 6 ခုပါသည့် ဟစ်စတိုဂရမ်တစ်ခုသည် မည်သို့မည်ပုံဖြစ်သည်-

ဒေတာထဲရှိ ဆူညံသံကို ရိုးရိုးရှင်းရှင်းမြင်ယောင်ရန် များပြားလွန်းခြင်းမရှိဘဲ အရင်းခံတန်ဖိုးများ ခွဲဝေမှုဆိုင်ရာ စိတ်ကူးကောင်းတစ်ခုရရန် လုံလောက်ပုံရသည်ကို သတိပြုပါ။
Sturges’ rule အတွက် ဘုံတန်ဖိုးများ
အောက်ပါဇယားသည် Sturges ၏စည်းမျဉ်းအရ ဒေတာအစုတစ်ခုရှိ စောင့်ကြည့်မှုစုစုပေါင်းအရေအတွက်အပေါ်အခြေခံ၍ histogram တွင် အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ကို ပြသသည်-

Sturges’ Rule ၏အခြားရွေးချယ်စရာများ
Sturges’ rule သည် histogram တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံး bins အရေအတွက်ကို ဆုံးဖြတ်ရန်အတွက် အသုံးအများဆုံးနည်းလမ်းဖြစ်သည်၊ သို့သော် အခြားနည်းလမ်းများစွာ အပါအဝင်၊
နှစ်ထပ်ကိန်း စည်းမျဉ်း – အကွက်အရေအတွက် = ⌈√ n ⌉
ဆန်စည်းကမ်း- ပုံးအရေအတွက် = ⌈2 * 3 √ n ⌉
Freedman-Diaconis စည်းမျဉ်း- သေတ္တာအရေအတွက် = (2*IQR) / 3 √ n IQR သည် interquartile အပိုင်းအခြားဖြစ်သည်။
အပိုဆု- Sturges စည်းမျဉ်းဂဏန်းတွက်စက်
ဒေတာအစုံ၏အရွယ်အစားပေါ်မူတည်၍ histogram အတွက်အသုံးပြုရန် အကောင်းဆုံးအုပ်စုအရေအတွက်ကို ဆုံးဖြတ်ရန် Sturges ၏စည်းမျဉ်းကို အလိုအလျောက်ကျင့်သုံးရန် ဤအခမဲ့အွန်လိုင်းဂဏန်းတွက်စက်ကို အသုံးပြုပါ။