Category: လမ်းညွှန်
ဒေတာအစုတစ်ခု၏ နံပါတ်တစ် ရာခိုင်နှုန်းသည် တန်ဖိုးအားလုံးကို အသေးဆုံးမှ အကြီးဆုံးသို့ စီခွဲလိုက်သောအခါ ဒေတာတန်ဖိုးများ၏ ထိပ်ပိုင်း n ရာခိုင်နှုန်းကို ဖြတ်တောက်သည့်တန်ဖိုးဖြစ်သည်။ ဥပမာအားဖြင့်၊ ဒေတာအတွဲတစ်ခု၏ 90th ရာခိုင်နှုန်းသည် ဒေတာတန်ဖိုးများ၏ 90% အောက်ခြေကို ဒေတာတန်ဖိုးများ၏ 10% နှင့် ပိုင်းခြားထားသည့် တန်ဖိုးဖြစ်သည်။ အောက်ပါ syntax ကိုအသုံးပြုသည့် numpy.percentile() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python တွင် ရာခိုင်နှုန်းများကို လျင်မြန်စွာတွက်ချက်နိုင်သည်- numpy.percentile(a၊ q) ရွှေ- a- တန်ဖိုးများဇယား q- 0...
ဒေတာအတွဲတစ်ခုပေါ်ရှိ မော်ဒယ်တစ်ခု၏စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်မှပြုလုပ်သော ခန့်မှန်းချက်များသည် စောင့်ကြည့်လေ့လာထားသောဒေတာနှင့် မည်မျှကိုက်ညီကြောင်း တိုင်းတာရန် လိုအပ်ပါသည်။ ဤကဲ့သို့လုပ်ဆောင်ရန်အတွက် အသုံးများသောနည်းလမ်းကို Leave-One-Out Cross-Validation (LOOCV) ဟုခေါ်သည်၊ အောက်ပါနည်းလမ်းကိုအသုံးပြုသည်- 1. လေ့ကျင့်ရေးအစု၏ တစ်စိတ်တစ်ပိုင်းအဖြစ် မှတ်သားမှုအားလုံးကို အသုံးပြု၍ ဒေတာအစုံကို လေ့ကျင့်ရေးအစုံနှင့် စမ်းသပ်မှုတစ်ခုအဖြစ် ခွဲလိုက်ပါ။ 2. လေ့ကျင့်မှုအစုံမှဒေတာကိုသာအသုံးပြု၍ မော်ဒယ်တစ်ခုဖန်တီးပါ။ 3. မော်ဒယ်မှဖယ်ထုတ်ထားသော စောင့်ကြည့်မှုတန်ဖိုးကို ခန့်မှန်းရန်နှင့် ပျမ်းမျှစတုရန်းအမှား (MSE) ကို တွက်ချက်ရန် မော်ဒယ်ကို အသုံးပြုပါ။ 4. ဤလုပ်ငန်းစဉ်...
ဒေတာအတွဲတစ်ခုပေါ်ရှိ မော်ဒယ်တစ်ခု၏စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်မှပြုလုပ်သော ခန့်မှန်းချက်များသည် စောင့်ကြည့်လေ့လာထားသောဒေတာနှင့် မည်မျှကိုက်ညီကြောင်း တိုင်းတာရန် လိုအပ်ပါသည်။ ၎င်းကိုတိုင်းတာရန်အသုံးအများဆုံးနည်းလမ်းမှာ အောက်ပါအတိုင်းတွက်ချက်ထားသည့် mean square error (MSE) ကိုအသုံးပြုခြင်းဖြစ်သည်။ MSE = (1/n)*Σ(y i – f(x i )) ၂ ရွှေ- n- လေ့လာတွေ့ရှိချက်စုစုပေါင်း y i : IT Observation ၏ တုံ့ပြန်မှုတန်ဖိုး f(x i ): i th...
ဒေတာအတွဲတစ်ခုပေါ်ရှိ မော်ဒယ်တစ်ခု၏စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်မှပြုလုပ်သော ခန့်မှန်းချက်များသည် စောင့်ကြည့်လေ့လာထားသောဒေတာနှင့် မည်မျှကိုက်ညီကြောင်း တိုင်းတာရန် လိုအပ်ပါသည်။ ၎င်းကိုလုပ်ဆောင်ရန်အတွက် အသုံးများသောနည်းလမ်းကို k-fold cross-validation ဟုခေါ်သည်၊ အောက်ပါနည်းလမ်းကိုအသုံးပြုသည်- 1. ခန့်မှန်းခြေ တူညီသော အရွယ်အစားရှိသော k အုပ်စုများ သို့မဟုတ် “ folds” အဖြစ် သတ်မှတ်ဒေတာကို ကျပန်းခွဲပါ။ 2. အထိန်းအချုပ်အဖြစ် ခြံများထဲမှ တစ်ခုကို ရွေးပါ။ နမူနာကို ကျန် k-1 ခေါက်သို့ ချိန်ညှိပါ။ တင်းမာနေသော အထပ်တွင် လေ့လာတွေ့ရှိချက်များကို...
ဒေတာအတွဲတစ်ခုပေါ်ရှိ မော်ဒယ်တစ်ခု၏စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်မှပြုလုပ်သော ခန့်မှန်းချက်များသည် စောင့်ကြည့်လေ့လာထားသောဒေတာနှင့် မည်မျှကိုက်ညီကြောင်း တိုင်းတာရန် လိုအပ်ပါသည်။ ၎င်းကိုလုပ်ဆောင်ရန်အတွက် အသုံးများသောနည်းလမ်းကို k-fold cross-validation ဟုခေါ်သည်၊ အောက်ပါနည်းလမ်းကိုအသုံးပြုသည်- 1. ခန့်မှန်းခြေ တူညီသော အရွယ်အစားရှိသော k အုပ်စုများ သို့မဟုတ် “ folds” အဖြစ် သတ်မှတ်ဒေတာကို ကျပန်းခွဲပါ။ 2. အထိန်းအချုပ်အဖြစ် ခြံများထဲမှ တစ်ခုကို ရွေးပါ။ နမူနာကို ကျန် k-1 ခေါက်သို့ ချိန်ညှိပါ။ တင်းမာနေသော အထပ်တွင် လေ့လာတွေ့ရှိချက်များကို...
စက်သင်ယူမှုတွင်၊ အချို့သောဖြစ်ရပ်များနှင့် ပတ်သက်၍ တိကျသောခန့်မှန်းချက်များကို ပြုလုပ်နိုင်စေရန်အတွက် ကျွန်ုပ်တို့သည် မော်ဒယ်များကို မကြာခဏတည်ဆောက်ပါသည်။ ဥပမာအားဖြင့်၊ အထက်တန်းကျောင်းသူကျောင်းသားများအတွက် တုံ့ပြန်မှုကိန်းရှင်၏ ACT ရမှတ်ကို ခန့်မှန်းရန် လေ့လာနေခဲ့သော ခန့်မှန်းကိန်းရှင် variable နာရီများကို အသုံးပြုသည့် ဆုတ်ယုတ်မှုပုံစံ ကို ဖန်တီးလိုသည်ဆိုပါစို့။ ဤပုံစံကို တည်ဆောက်ရန်အတွက်၊ ကျောင်းခရိုင်တစ်ခုရှိ ကျောင်းသားရာနှင့်ချီအတွက် သက်ဆိုင်သော ACT ရမှတ်များကို လေ့လာသည့် နာရီများနှင့် သက်ဆိုင်သည့် အချက်အလက်များကို စုဆောင်းပါမည်။ ထို့နောက် သင်ကြားခဲ့သည့် စုစုပေါင်းနာရီအရေအတွက်အပေါ် အခြေခံ၍ ပေးထားသည့် ကျောင်းသားရရှိမည့်ရမှတ်နှင့်ပတ်သက်၍ ခန့်မှန်းချက်များကို...
Bootstrapping သည် မည်သည့် ကိန်းဂဏန်းများ၏ စံအမှားကို ခန့်မှန်းရန်နှင့် စာရင်းအင်းအတွက် ယုံကြည်စိတ်ချရသော ကြားကာလကို ဖန်တီးရန် အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ bootstrapping အတွက် အခြေခံလုပ်ငန်းစဉ်မှာ အောက်ပါအတိုင်းဖြစ်သည်။ ပေးထားသောဒေတာအစုံမှ အစားထိုးခြင်းဖြင့် k နမူနာများကို ပုံတူပွားယူပါ။ နမူနာတစ်ခုစီအတွက် အတိုးနှုန်းစာရင်းကို တွက်ချက်ပါ။ ၎င်းသည် ပေးထားသော ကိန်းဂဏန်းတစ်ခုအတွက် မတူညီသော ခန့်မှန်းချက်များကို k ပေးသည်၊ ထို့နောက် စာရင်းအင်း၏ စံအမှားကို တွက်ချက်ရန်နှင့် စာရင်းအင်းအတွက် ယုံကြည်မှုကြားကာလကို ဖန်တီးနိုင်သည်။ bootstrap စာကြည့်တိုက် မှ...
စက်သင်ယူမှုတွင်၊ ကျွန်ုပ်တို့သည် ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် တစ်ခုကို အသုံးပြု၍ မော်ဒယ်များကို မကြာခဏ တည်ဆောက်လိုပါသည်။ ကျွန်ုပ်တို့၏ပန်းတိုင်မှာ တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းရန် ခန့်မှန်းသူကိန်းရှင်များကို ထိရောက်စွာအသုံးပြုနိုင်သည့် မော်ဒယ်တစ်ခုကို တည်ဆောက်ရန်ဖြစ်သည်။ p စုစုပေါင်း ကြိုတင်ခန့်မှန်းကိန်းရှင်များ အစုံလိုက်ဖြင့် ကျွန်ုပ်တို့ တည်ဆောက်နိုင်သည့် မော်ဒယ်များစွာ ရှိပါသည်။ အကောင်းဆုံး မော်ဒယ်ကို ရွေးချယ်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုမှာ အကောင်းဆုံး အမျိုးအစားခွဲရွေးချယ်ခြင်း ဟု လူသိများပြီး အောက်ပါအတိုင်း လုပ်ဆောင်နိုင်သည်- 1. M 0 ကို ကြိုတင်ခန့်မှန်းနိုင်သော...
စက်သင်ယူမှုနယ်ပယ်တွင်၊ ကျွန်ုပ်တို့၏ရည်မှန်းချက်မှာ တုံ့ပြန်မှုကိန်းရှင် ၏တန်ဖိုးကို ခန့်မှန်းရန် ကြိုတင်ခန့်မှန်းသူကိန်းရှင်များအစုအဝေးကို ထိထိရောက်ရောက်အသုံးပြုနိုင်သည့် မော်ဒယ်တစ်ခုကို ဖန်တီးရန်ဖြစ်သည်။ p စုစုပေါင်း ကြိုတင်ခန့်မှန်းကိန်းရှင်များ အစုံလိုက်ဖြင့် ကျွန်ုပ်တို့ တည်ဆောက်နိုင်သည့် မော်ဒယ်များစွာ ရှိပါသည်။ အကောင်းဆုံးမော်ဒယ်ကို ရွေးချယ်ရန် ကျွန်ုပ်တို့သုံးနိုင်သည့် နည်းလမ်းတစ်ခုမှာ ခန့်မှန်းတွက်ချက်မှုများဖြင့် တည်ဆောက်နိုင်သည့် ဖြစ်နိုင်ခြေရှိသော မော်ဒယ်များ အားလုံး မှ အကောင်းဆုံးမော်ဒယ်ကို ရွေးချယ်ရန် ကြိုးစားသည့် အကောင်းဆုံးအတွဲခွဲရွေးချယ်ခြင်း ဟု လူသိများသည်။ ကံမကောင်းစွာနဲ့ပဲ ဒီနည်းလမ်းဟာ အားနည်းချက်နှစ်ခုကို ကြုံတွေ့နေရပါတယ်။ ဒါက တွက်ချက်မှုအရ ပြင်းထန်နိုင်ပါတယ်။ p...
မကြာခဏရက်စွဲနှင့်အချိန်ဒေတာကို R သို့တင်သွင်းသောအခါ၊ တန်ဖိုးများကို strings အဖြစ်တင်သွင်းလိမ့်မည်။ R တွင် လိုင်းများကို ရက်စွဲများအဖြစ်သို့ ပြောင်းရန် အလွယ်ဆုံးနည်းလမ်းမှာ အောက်ပါ syntax ကိုအသုံးပြုသည့် as.Date() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်- ကြိုက်သည်။ရက်စွဲ(x၊ ဖော်မတ်) ရွှေ- x- စာကြောင်းတန်ဖိုးတစ်ခု သို့မဟုတ် စာကြောင်းတန်ဖိုးများ၏ vector တစ်ခု။ ဖော်မတ်- ရက်စွဲအတွက် အသုံးပြုရန် ဖော်မတ်။ မူရင်းမှာ YYYY-MM-DD ဖြစ်သည်။ ရက်စွဲဖော်မတ်အတွက် အသုံးပြုရန်ရရှိနိုင်သည့် အကြောင်းပြချက်များစာရင်းအပြည့်အစုံကိုပြသရန် R တွင် ?strftime ကွန်မန်းကို...