Category: လမ်းညွှန်
စွန့်စားရနိုင်သော အန္တရာယ် ဆိုသည်မှာ အန္တရာယ်အချက်တစ်ခုနှင့် ထိတွေ့နေရသူများနှင့် ထိုအန္တရာယ်အချက်နှင့် မထိတွေ့ရသူများကြား ဖြစ်ပွားမှုနှုန်း ကွာခြားချက်ကို ရည်ညွှန်းသည်။ ဥပမာအားဖြင့်၊ ဆေးလိပ်သောက်သူများ (ထိတွေ့နေသူများ) နှင့် ဆေးလိပ်မသောက်သူများ (မထိတွေ့ရသေးသူများ) အကြား နှလုံးသွေးကြောဆိုင်ရာရောဂါ (ဖြစ်ပွားမှု) ကွာခြားချက်ကို နားလည်ရန် ဤအတိုင်းအတာကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။ ပုံမှန်အားဖြင့်၊ ကျွန်ုပ်တို့သည် အန္တရာယ်အချက်တစ်ခုကြောင့်ဟု ယူဆနိုင်သော ဖြစ်ပွားမှုနှုန်း၏ ရာခိုင်နှုန်းကို ရည်ညွှန်းသည့် ရည်ညွှန်းနိုင်သော ရာခိုင်နှုန်းကို တွက်ချက်ပါသည်။ ကျွန်ုပ်တို့သည် အန္တရာယ်အချက်တစ်ခုကြောင့်ဟု ယူဆနိုင်သည့် အလုံးစုံလူဦးရေ၏ ဖြစ်ပွားမှုနှုန်းရာခိုင်နှုန်းကို ရည်ညွှန်းသည့် လူဦးရေဖြစ်နိုင်သော...
Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှု variable အကြား ဆက်နွယ်မှုကို တွက်ချက်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ ယေဘူယျအားဖြင့် ကျွန်ုပ်တို့သည် ပမာဏကိန်းရှင်များ နှင့်အတူ linear regression ကိုအသုံးပြုသည်။ တစ်ခါတစ်ရံ “ဂဏန်း” ကိန်းရှင်များဟု ခေါ်သည်၊ ၎င်းတို့သည် တိုင်းတာနိုင်သော ပမာဏကို ကိုယ်စားပြုသော ကိန်းရှင်များဖြစ်သည်။ ဥပမာများ ပါဝင်သည်- အိမ်တစ်အိမ်တွင် စတုရန်းပေ အရေအတွက် မြို့၏လူဦးရေအရွယ်အစား တစ်ဦးချင်း၏အသက် သို့သော် တစ်ခါတစ်ရံတွင် ကျွန်ုပ်တို့သည်...
dummy variable သည် regression ခွဲခြမ်းစိတ်ဖြာမှုတွင် ကျွန်ုပ်တို့ဖန်တီးထားသော variable အမျိုးအစားတစ်ခုဖြစ်ပြီး တန်ဖိုးနှစ်ခုမှ တစ်ခုဖြစ်သော သုည သို့မဟုတ် တစ်ခုအား ကိန်းဂဏာန်းကိန်းရှင်အဖြစ် categorical variable အဖြစ် ကိုယ်စားပြုနိုင်စေရန်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိပြီး ဝင်ငွေကို ခန့်မှန်းရန် အသက်အရွယ် နှင့် အိမ်ထောင်ရေးအဆင့်အတန်းကို အသုံးပြုလိုသည်ဆိုပါစို့။ ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ အိမ်ထောင်ရေးအခြေအနေအား ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်အဖြစ် အသုံးပြုရန်၊ ၎င်းကို အတုမဲ့ကိန်းရှင်အဖြစ် ပြောင်းလဲရန် လိုအပ်သည်။ ၎င်းသည် လောလောဆယ်တွင် မတူညီသောတန်ဖိုး (“ လူပျို” ၊...
dummy variable သည် regression ခွဲခြမ်းစိတ်ဖြာမှုတွင် ကျွန်ုပ်တို့ဖန်တီးထားသော variable အမျိုးအစားတစ်ခုဖြစ်ပြီး တန်ဖိုးနှစ်ခုမှ တစ်ခုဖြစ်သော သုည သို့မဟုတ် တစ်ခုအား ကိန်းဂဏာန်းကိန်းရှင်အဖြစ် categorical variable အဖြစ် ကိုယ်စားပြုနိုင်စေရန်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိပြီး ဝင်ငွေကို ခန့်မှန်းရန် အသက်အရွယ် နှင့် အိမ်ထောင်ရေးအဆင့်အတန်းကို အသုံးပြုလိုသည်ဆိုပါစို့။ ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ အိမ်ထောင်ရေးအခြေအနေအား ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်အဖြစ် အသုံးပြုရန်၊ ၎င်းကို အတုမဲ့ကိန်းရှင်အဖြစ် ပြောင်းလဲရန် လိုအပ်သည်။ ၎င်းသည် လောလောဆယ်တွင် မတူညီသောတန်ဖိုး (“ လူပျို” ၊...
Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှု variable အကြား ဆက်နွယ်မှုကို တွက်ချက်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ ယေဘူယျအားဖြင့် ကျွန်ုပ်တို့သည် ပမာဏကိန်းရှင်များ နှင့်အတူ linear regression ကိုအသုံးပြုသည်။ တစ်ခါတစ်ရံ “ဂဏန်း” ကိန်းရှင်များဟု ခေါ်သည်၊ ၎င်းတို့သည် တိုင်းတာနိုင်သော ပမာဏကို ကိုယ်စားပြုသော ကိန်းရှင်များဖြစ်သည်။ ဥပမာများ ပါဝင်သည်- အိမ်တစ်အိမ်တွင် စတုရန်းပေ အရေအတွက် မြို့၏လူဦးရေအရွယ်အစား တစ်ဦးချင်း၏အသက် သို့သော် တစ်ခါတစ်ရံတွင် ကျွန်ုပ်တို့သည်...
တခါတရံတွင် ဝေါဟာရနှစ်ခုကို ဆက်စပ်မှု နှင့် ဆက်စပ်မှု ဟု အပြန်အလှန်သုံးကြသည်။ သို့သော် စာရင်းဇယားနယ်ပယ်တွင် ဤဝေါဟာရနှစ်ခုသည် အနည်းငယ်ကွဲပြားသော အဓိပ္ပါယ်ရှိသည်။ အထူးသဖြင့်၊ ကျွန်ုပ်တို့သည် ဆက်စပ်မှုဟူသော စကားလုံးကိုသုံးသောအခါ၊ ကျွန်ုပ်တို့သည် များသောအားဖြင့် Pearson ဆက်စပ်ဆက်စပ်ကိန်း ကို ပြောလေ့ရှိကြသည်။ ၎င်းသည် ကျပန်းမပြောင်းလဲနိုင်သော X နှင့် Y နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်စပ်မှုကို တိုင်းတာမှုတစ်ခုဖြစ်သည်။ ၎င်းတွင် -1 နှင့် 1 အကြား တန်ဖိုးတစ်ခုရှိသည်။ -1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပျက်သဘောဆောင်သော ဆက်စပ်ဆက်နွယ်မှုကို...
Excel ရှိ ရက်စွဲနှစ်ခုကြား ခြားနားချက်ကို တွက်ချက်ရန် DATEDIF() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်- =DATEDIF(စတင်_ရက်စွဲ၊ အဆုံး_ရက်စွဲ၊ မက်ထရစ်) ရွှေ- စတင်_ရက်စွဲ- စတင်ရက်စွဲ ကုန်ဆုံးရက်စွဲ- ကုန်ဆုံးရက်စွဲ မက်ထရစ်- တွက်ချက်ရန် မက်ထရစ်။ ရွေးချယ်စရာများ ပါဝင်သည်- “ d” : ရက် “ m” : လ “ y” : နှစ် သင် =DATEDIF( ဆဲလ်များထဲမှ...
စာရင်းဇယားများတွင်၊ ဖြစ်နိုင်ခြေ ဖြန့်ဝေမှုတွင် အနာဂတ်ဖြစ်ရပ်တစ်ခု၏ ဖြစ်နိုင်ခြေသည် အတိတ်ဖြစ်ရပ်များ ဖြစ်ပေါ်လာခြင်းကြောင့် မထိခိုက်ပါက မမေ့နိုင်သော ပိုင်ဆိုင်မှု တစ်ခုဟု ဆိုပါသည်။ memoryless property နှင့် ဖြစ်နိုင်ခြေ ဖြန့်ဝေမှု နှစ်ခုသာ ရှိသည်- အနုတ်လက္ခဏာမဟုတ်သော အစစ်အမှန် ကိန်းဂဏာန်းများဖြင့် ကိန်းဂဏန်း ဖြန့်ချီမှု ။ အနုတ်လက္ခဏာမဟုတ်သော ကိန်းပြည့်များဖြင့် ဂျီဩမေတြီ ဖြန့်ဖြူးမှု ။ ဤဖြစ်နိုင်ခြေ ဖြန့်ဝေမှုနှစ်ခုကို ဖြစ်ရပ်တစ်ခုမဖြစ်ပွားမီ မျှော်လင့်ထားသည့်အချိန်ကို နမူနာပုံစံပြုလုပ်ရန် အသုံးပြုပါသည်။ အချိန်မည်မျှကုန်သွားသည်ကို သိရှိခြင်းသည် မည်သည့်အချိန်၌မဆို အဖြစ်အပျက်တစ်ခုသည် မကြာမီ...
R ကော်လံအများအပြားရှိ အမြင့်ဆုံးတန်ဖိုးကို ရှာဖွေရန် pmax() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကို အသုံးပြုသည်- pmax(…၊ na.rm = FALSE) ရွှေ- … : vector များစာရင်း na.rm: ပျောက်ဆုံးနေသောတန်ဖိုးများကို ဖယ်ရှားသင့်သလားကို ညွှန်ပြသော ယုတ္တိဒြပ်စင်တစ်ခု။ မူရင်းတန်ဖိုးသည် မှားနေသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ကို အသုံးပြု၍ ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်း ဥပမာများစွာကို ပေးသည်- #create data frame df <-...
R ရှိ stringr package ၏ str_replace() လုပ်ဆောင်ချက်ကို string တစ်ခုရှိ ကိုက်ညီသည့်ပုံစံများကို အစားထိုးရန် အသုံးပြုနိုင်သည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်- str_replace(string၊ ပုံစံ၊ အစားထိုး) ရွှေ- string- စာလုံး vector မော်ဒယ်- ရှာဖွေရန် မော်ဒယ် အစားထိုးခြင်း- အစားထိုးစာလုံးများ၏ ကွက်ကွက် ဤသင်ခန်းစာသည် အောက်ပါဒေတာဘောင်တွင် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးပြုနိုင်သည့် နမူနာများစွာကို ပေးသည်- #create data frame df <- data....