Category: လမ်းညွှန်
စံသတ်မှတ်ချက်များစွာဖြင့် အရာများကို အဆင့်သတ်မှတ်ရန် Excel ရှိ RANK.EQ() နှင့် COUNTIFS() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်။ အောက်ပါဥပမာသည် Excel ရှိ စံသတ်မှတ်ချက်များစွာဖြင့် စာရင်းတစ်ခုအတွင်းရှိ အရာများကို စီရန် ဤလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ပြသထားသည်။ ဥပမာ- Excel တွင် စံနှုန်းများစွာအရ အမျိုးအစားခွဲခြားခြင်း။ ကျွန်ုပ်တို့တွင် စုစုပေါင်းအမှတ်များကိုပြသပြီး မတူညီသောဘတ်စကတ်ဘောကစားသမားရှစ်ဦးအတွက် ကူညီပေးသည့် Excel တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုကြပါစို့။ ယခု ကျွန်ုပ်တို့သည် အောက်ပါသတ်မှတ်ချက်များကို အသုံးပြု၍ ကစားသမားတစ်ဦးစီကို အဆင့်သတ်မှတ်လိုသည်ဆိုပါစို့။ ပထမဦးစွာ ကစားသမားတစ်ဦးစီကို ၎င်းတို့၏...
စာရင်းဇယားများတွင်၊ ကျွန်ုပ်တို့သည် အုပ်စုနှစ်ခု၏ ဆိုလိုရင်းတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ရှိမရှိကို ဆုံးဖြတ်ရန် p-values များကို အသုံးပြုလေ့ရှိပါသည်။ သို့သော်လည်း၊ အုပ်စုနှစ်ခုကြားတွင် ကိန်းဂဏန်းအချက်အလတ် သိသိသာသာကွာခြားမှု ရှိ/မရှိကို p-value က ကျွန်ုပ်တို့ကို ပြောပြနိုင်သော်လည်း အကျိုးသက်ရောက်မှုအရွယ်အစားက ထိုကွာခြားချက်မှာ အမှန်တကယ် မည်မျှကြီးမားသည်ကို ပြောပြနိုင်ပါသည်။ အကျိုးသက်ရောက်မှုအရွယ်အစား၏ အသုံးအများဆုံးတိုင်းတာမှုတစ်ခုမှာ Cohen’s d ဖြစ်ပြီး၊ အောက်ပါအတိုင်းတွက်ချက်သည်။ Cohen’s D = ( x1 – x2 ) / √...
R ရှိ ဒေတာဘောင်တစ်ခုမှ ထပ်နေသောအတန်းများကို ဖယ်ရှားရန် နည်းလမ်းနှစ်ခုအနက်မှ တစ်ခုကို သင်အသုံးပြုနိုင်သည်- နည်းလမ်း 1- Base R ကိုသုံးပါ။ #remove duplicate rows across entire data frame df[ ! duplicated(df), ] #remove duplicate rows across specific columns of data frame df[ ! duplicated(df[c(' var1 ')]), ] နည်းလမ်း 2:...
ဆုတ်ယုတ်မှုပုံစံ၏ မှတ်တမ်းဖြစ်နိုင်ခြေတန်ဖိုး သည် မော်ဒယ်တစ်ခု၏ အံဝင်ခွင်ကျကောင်းမွန်မှုကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ log-likelihood value ပိုများလေ၊ model သည် data set တစ်ခုနှင့် ပိုအဆင်ပြေလေဖြစ်သည်။ ပေးထားသောမော်ဒယ်တစ်ခုအတွက် မှတ်တမ်းဖြစ်နိုင်ခြေတန်ဖိုးသည် အနုတ်လက္ခဏာ infinity မှ positive infinity အထိရှိနိုင်ပါသည်။ ပေးထားသောမော်ဒယ်အတွက် အမှန်တကယ် မှတ်တမ်းဖြစ်နိုင်ခြေတန်ဖိုးသည် ယေဘုယျအားဖြင့် အဓိပ္ပါယ်မရှိသော်လည်း မော်ဒယ်နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော မော်ဒယ်များကို နှိုင်းယှဉ်ရန်အတွက် အသုံးဝင်သည် ။ လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် ဒေတာအတွဲတစ်ခုတွင် အကြိမ်ပေါင်းများစွာ ဆုတ်ယုတ်မှုပုံစံများကို မကြာခဏ...
Bayesian Information Criterion ၊ မကြာခဏ အတိုကောက် BIC သည် မတူညီသော ဆုတ်ယုတ်မှုပုံစံများ၏ အံဝင်ခွင်ကျရှိမှုကို နှိုင်းယှဉ်ရန် အသုံးပြုသည့် အတိုင်းအတာတစ်ခုဖြစ်သည်။ လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် တူညီသောဒေတာအတွဲတွင် ဆုတ်ယုတ်မှုပုံစံများစွာကို ဖြည့်သွင်းပြီး ဒေတာနှင့်အကိုက်ညီဆုံးမော်ဒယ်အဖြစ် အနိမ့်ဆုံး BIC တန်ဖိုးရှိသော မော်ဒယ်ကို ရွေးချယ်ပါ။ ကျွန်ုပ်တို့သည် BIC ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုပါသည်။ BIC- (RSS+log(n)dσ̂ 2 ) / n ရွှေ- d- ကြိုတင်ခန့်မှန်းသူအရေအတွက် n- စုစုပေါင်းလေ့လာတွေ့ရှိချက်...
Bayesian Information Criterion ၊ မကြာခဏ အတိုကောက် BIC သည် မတူညီသော ဆုတ်ယုတ်မှုပုံစံများ၏ အံဝင်ခွင်ကျရှိမှုကို နှိုင်းယှဉ်ရန် အသုံးပြုသည့် အတိုင်းအတာတစ်ခုဖြစ်သည်။ လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် တူညီသောဒေတာအတွဲတွင် ဆုတ်ယုတ်မှုပုံစံများစွာကို ဖြည့်သွင်းပြီး ဒေတာနှင့်အကိုက်ညီဆုံးမော်ဒယ်အဖြစ် အနိမ့်ဆုံး BIC တန်ဖိုးရှိသော မော်ဒယ်ကို ရွေးချယ်ပါ။ ကျွန်ုပ်တို့သည် BIC ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုပါသည်။ BIC- (RSS+log(n)dσ̂ 2 ) / n ရွှေ- d- ခန့်မှန်းသူအရေအတွက် n- စုစုပေါင်းလေ့လာတွေ့ရှိချက်...
R တွင် သင်ကြုံတွေ့ရနိုင်သော အမှားအယွင်း မက်ဆေ့ချ်သည်- Coefficients: (1 not defined because of singularities) R တွင် glm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မော်ဒယ်တစ်ခုနှင့် အံဝင်ခွင်ကျဖြစ်ချိန်တွင် သင့်ခန့်မှန်းပေးသူ ကိန်းရှင်နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော တစ်ခုနှင့်တစ်ခု တိကျသော linear ဆက်နွယ်မှုရှိသည် — perfect multicollinearity ဟုခေါ်သည်။ ဤအမှားကို ပြင်ဆင်ရန်၊ တစ်ခုနှင့်တစ်ခု ပြီးပြည့်စုံသော ဆက်နွယ်မှုရှိသော သင့်ဒေတာအတွဲရှိ ကိန်းရှင်များကို ခွဲခြားသတ်မှတ်ရန် cor() လုပ်ဆောင်ချက်ကို...
ယေဘူယျ မျဉ်းသား မော်ဒယ် ( logistic regression ၊ Poisson ဆုတ်ယုတ်မှု ၊ စသည်ဖြင့် ) နှင့် ကိုက်ညီသည့်အခါတိုင်း၊ စာရင်းအင်း ဆော့ဖ်ဝဲလ် အများစုသည် မော်ဒယ်၏ ကျန်ရှိသော သုညသွေဖည်မှု နှင့် မော်ဒယ်၏ ကျန်ရှိသော ကွဲလွဲမှုများ အတွက် တန်ဖိုးများကို ထုတ်လုပ်ပေးပါသည်။ မူရင်းအသုံးအနှုန်းတစ်ခုသာရှိသော မော်ဒယ်တစ်ခုမှ တုံ့ပြန်မှုကိန်းရှင်အား မည်မျှ ကောင်းစွာ ခန့်မှန်းနိုင်သည်ကို Zero deviance က ပြောပြသည်။ ကျန်ရှိသောသွေဖည်မှုသည် p ကိန်းရှင်ကိန်းရှင်များဖြင့် တုံ့ပြန်မှုကိန်းရှင်အား...
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ ကျပန်းပြောင်းလွဲချက်များကို iid ဟုခေါ်သည် – အမှီအခိုကင်းစွာနှင့် တူညီစွာဖြန့်ဝေခြင်း – အောက်ပါအခြေအနေနှစ်ခုနှင့်ကိုက်ညီပါက- (၁) အမှီအခိုကင်းမှု – ဖြစ်ရပ်တစ်ခု၏ ရလဒ်သည် အခြားတစ်ခု၏ ရလဒ်အပေါ် သက်ရောက်မှုမရှိပါ။ (2) တူညီစွာ ဖြန့်ဝေခြင်း – ဖြစ်ရပ်တစ်ခုစီ၏ ဖြစ်နိုင်ခြေ ဖြန့်ဝေမှုသည် တူညီပါသည်။ အောက်ဖော်ပြပါ အခြေအနေများသည် လက်တွေ့တွင် iid ကျပန်းပြောင်းလဲနိုင်သော နမူနာများကို ဖော်ပြသည်။ ဥပမာ 1- အကြွေစေ့ကိုလှန်ပါ။ ကျွန်ုပ်တို့သည် အကြွေစေ့ကို ၁၀ ကြိမ်လှန်ပြီး အကြွေစေ့ခေါင်းပေါ် တက်လာသည့်...
Logistic regression သည် တုံ့ပြန်မှု variable binary ဖြစ်သောအခါ ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် ဆုတ်ယုတ်မှုအမျိုးအစားတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏ အရည်အသွေးကို အကဲဖြတ်ရန် ဘုံနည်းလမ်းမှာ စမ်းသပ်ဒေတာအတွဲ၏ အမှန်တကယ်တန်ဖိုးများနှင့် မော်ဒယ်၏ ခန့်မှန်းတန်ဖိုးများကို ပြသသည့် 2×2 ဇယားဖြစ်သည့် ရှုပ်ထွေးသောမက်ထရစ် ကို ဖန်တီးရန်ဖြစ်သည်။ Python ရှိ logistic regression model အတွက် ရှုပ်ထွေးသော matrix တစ်ခုကို ဖန်တီးရန်၊ sklearn package မှ confusion_matrix() function ကို အသုံးပြုနိုင်ပါသည်။...