Category: လမ်းညွှန်
စာရင်းဇယားများတွင် ကျောင်းသားများ မကြာခဏ ရောထွေးနေသော ဝေါဟာရနှစ်ခုမှာ ဖြစ်နိုင်ခြေ နှင့် အချိုးအစား ဖြစ်သည်။ ဤတွင် ကွာခြားချက်မှာ- ဖြစ်နိုင်ခြေသည် အဖြစ်အပျက်တစ်ခု၏ အခွင့်အလမ်းများကို ကိုယ်စားပြုသည်။ အဲဒါ သီအိုရီပါ ။ အချိုးအစားသည် ဖြစ်ရပ်တစ်ခု အမှန်တကယ် ဖြစ်ပွားသည့် အကြိမ်အရေအတွက်ကို အကျဉ်းချုပ်ဖော်ပြသည်။ ဒါဟာ အင်ပါယာပဲ ။ ကျွန်ုပ်တို့သည် အနာဂတ်တွင် ဖြစ်ပျက်မည့် အဖြစ်အပျက်တစ်ခု ဖြစ်နိုင်ခြေများကို ပြောဆိုရန် ဖြစ်နိုင်ခြေကို မကြာခဏ အသုံးပြုပါသည်။ ဆန့်ကျင်ဘက်အားဖြင့်၊ ကျွန်ုပ်တို့သည် အတိတ်တွင် အမှန်တကယ်ဖြစ်ပျက်ခဲ့သည့် အကြိမ်အရေအတွက်ကို...
အောက်ပါဖော်မတ်ကိုယူသည့် 2×2 ဇယားကို ခွဲခြမ်းစိတ်ဖြာသည့်အခါ ဆက်စပ်အန္တရာယ်ကို မကြာခဏ တွက်ချက်သည်- ဆက်စပ်အန္တရာယ်သည် ထိန်းချုပ်မှုအုပ်စုတွင် ဖြစ်ပွားသည့် ဖြစ်ရပ်တစ်ခု၏ ဖြစ်နိုင်ခြေနှင့် နှိုင်းယှဉ်ပါက ကုသမှုအုပ်စုတစ်ခုတွင် အဖြစ်အပျက်တစ်ခု ဖြစ်ပွားနိုင်ခြေကို ပြောပြသည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ ဆက်စပ်အန္တရာယ် = [A/(A+B)] / [C/(C+D)] ထို့နောက် ကျွန်ုပ်တို့သည် ဆွေမျိုးအန္တရာယ် (RR) အတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုနိုင်ပါသည်။ CI ထက်နည်းသော 95% = e ln(RR) – 1.96√...
စာရင်းဇယားများတွင်၊ ကိန်းရှင်အားလုံးကို တိုင်းတာမှုစကေးလေးခုအနက်တစ်ခုပေါ်တွင် တိုင်းတာသည်- Nominal : အရေအတွက်တန်ဖိုးများ မရှိသော ကိန်းရှင်များ။ Ordinal : သဘာဝအစီအစဥ်ရှိသော်လည်း တန်ဖိုးများကြားတွင် အရေအတွက် ကွာခြားချက်မရှိပါ။ ကြားကာလ – သဘာဝအစီအစဥ်တစ်ခုနှင့် တန်ဖိုးများအကြား အတိုင်းအတာတစ်ခုအထိ ခြားနားချက်ရှိသော်လည်း “စစ်မှန်သောသုည” တန်ဖိုးမရှိပါ။ အချိုးအစား – သဘာဝအစီအစဥ်တစ်ခု၊ တန်ဖိုးများအကြား ကိန်းဂဏန်းခြားနားချက်နှင့် “ စစ်မှန်သော သုည” တန်ဖိုးရှိသော ကိန်းရှင်များ။ အောက်ပါဂရပ်သည် ဤမတူညီသောတိုင်းတာမှုအဆင့်များကို အကျဉ်းချုပ်ဖော်ပြသည်- ကျောင်းသားတွေ မေးလေ့ရှိတဲ့ မေးခွန်းတစ်ခုကတော့ “ အသက်”...
Variance သည် data set တစ်ခုတွင် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။ လူဦးရေကွဲလွဲမှုကို တွက်ချက်ရန် ဖော်မြူလာမှာ- σ 2 = Σ (x i – μ) 2 / N ရွှေ- ∑ : “ပေါင်း” ဟူသော သင်္ကေတ၊ μ : လူဦးရေ ပျမ်းမျှ x i : လူဦးရေ၏ i th ဒြပ်စင် N...
Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို တွက်ချက်ရန် ကျွန်ုပ်တို့အသုံးပြုသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ မျဉ်းကြောင်းပြန်ဆုတ်ခြင်း၏ အဓိကယူဆချက်တစ်ခုသည် အကြွင်းအကျန်များသည် ကြိုတင်ခန့်မှန်းကိန်းရှင်ကိန်းရှင်အဆင့်တစ်ခုစီတွင် အဆက်မပြတ်ကွဲလွဲနေခြင်းဖြစ်သည်။ ဤယူဆချက်အား အတည်မပြုပါက ကျန်လူများသည် မျိုးကွဲကွဲပြားမှု ဒဏ်ကို ခံစားကြရမည်ဖြစ်သည်။ ထိုသို့ဖြစ်လာသောအခါ၊ မော်ဒယ်၏ကိန်းဂဏန်းခန့်မှန်းချက်သည် ယုံကြည်စိတ်ချရခြင်းမရှိပါ။ အဆက်မပြတ်ကွဲလွဲမှုကို အကဲဖြတ်နည်း ဆုတ်ယုတ်မှုပုံစံတစ်ခု၏ ကျန်ကြွင်းသောအရာများသည် အဆက်မပြတ်ကွဲလွဲမှုရှိမရှိကို ဆုံးဖြတ်ရန် အသုံးအများဆုံးနည်းလမ်းမှာ အကြွင်းအကျန်များနှင့် အံဝင်ခွင်ကျရှိသော တန်ဖိုးများကို ဖန်တီးရန်ဖြစ်သည်။ ၎င်းသည် x-ဝင်ရိုးတစ်လျှောက် ဆုတ်ယုတ်မှုပုံစံ၏...
စာရင်းဇယားများတွင်၊ odds ratio သည် ကုသမှုအုပ်စုတစ်ခုတွင် ဖြစ်ပျက်နေသော အဖြစ်အပျက်တစ်ခု၏ မသာမယာအချိုးအစားကို ထိန်းချုပ်သည့်အုပ်စုတွင် ဖြစ်ပျက်နေသည့် အဖြစ်အပျက်တစ်ခု၏ မသာမယာများနှင့် အချိုးကို ပြောပြသည်။ အချိုးမညီမှုတစ်ခုကို ကျွန်ုပ်တို့အစီရင်ခံသောအခါ၊ ကျွန်ုပ်တို့သည် ပုံမှန်အားဖြင့် အောက်ပါတို့ကို ထည့်သွင်းသည်- အချိုးမညီသောတန်ဖိုး အလေးသာအချိုးအတွက် ယုံကြည်မှုကြားကာလ ပြဿနာ၏ဆက်စပ်နေသော မသာမယာအချိုးကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ ဥပမာအားဖြင့်၊ ဤကဲ့သို့သောအရာတစ်ခုကို ကျွန်ုပ်တို့ အစီရင်ခံနိုင်သည်- ဆေးလိပ်သောက်ခြင်းနှင့် ဆေးလိပ်မသောက်သောအုပ်စုများကြားတွင် မည်သည့်ရောဂါကူးစက်နိုင်ခြေများ (OR = 1.44၊ 95% CI [0.91၊ 1.97])။ မှတ်ချက်...
Logistic regression သည် response variable binary ဖြစ်သောအခါ ကျွန်ုပ်တို့အသုံးပြုသည့် regression analysis အမျိုးအစားတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏ ရလဒ်များကို အစီရင်ခံရန် အောက်ပါ အထွေထွေဖော်မတ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။ Logistic regression ကို [predictor variable 1]၊ [predictor variable 2]၊…[predictor variable n ] နှင့် [response variable] အကြား ဆက်စပ်မှုကို ပိုင်းခြားစိတ်ဖြာရန် အသုံးပြုပါသည်။ အခြားကြိုတင်ခန့်မှန်းကိန်းရှင်များအားလုံးကို အဆက်မပြတ်ကိုင်ဆောင်ထားခြင်းဖြင့်၊ တစ်ယူနစ်တစ်ခုတိုးလာရန်အတွက်...
Polynomial regression သည် ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) နှင့် တုံ့ပြန်မှုကိန်းရှင်သည် linear မဟုတ်သည့်အခါ ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံဝင်ခွင်ကျဖြစ်စေရန်အတွက် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ polynomial regression model သည် အောက်ပါပုံစံကို ယူပါသည်။ Y = β 0 + β 1 X + β 2 X 2 + … + β h လက်တွေ့တွင်၊ linear regression ကဲ့သို့သော ရိုးရှင်းသောပုံစံနှင့်...
စာရင်းဇယားများတွင်၊ သဘောတရားဆိုင်ရာ ကိန်းရှင်သည် ကျွန်ုပ်တို့တိုင်းတာလိုသည့် တည်ဆောက်မှု သို့မဟုတ် စိတ္တဇအရာတစ်ခုကို ကိုယ်စားပြုသည်။ သို့သော်၊ ကျွန်ုပ်တို့သည် သဘောတရားဆိုင်ရာ ကိန်းရှင်ကို တိုက်ရိုက်တိုင်းတာခြင်းမပြုနိုင်ပါ၊ ထို့ကြောင့် ကျွန်ုပ်တို့သည် သဘောတရားဆိုင်ရာ ကိန်းရှင်ကို အရေအတွက်သတ်မှတ်ရန် အမှန်တကယ်တိုင်းတာမှုကို အသုံးပြုပါသည်။ ဥပမာအားဖြင့်၊ သုတေသီတစ်ဦးသည် တစ်ဦးချင်းစီ၏ “ အလုံးစုံပျော်ရွှင်မှု” ကို အကဲဖြတ်လိုသည်ဆိုပါစို့။ ဤသည်မှာ လူတစ်ဦးချင်းစီအား “ အလုံးစုံပျော်ရွှင်မှု” တန်ဖိုးကို တိုက်ရိုက်သတ်မှတ်ရန် နည်းလမ်းမရှိသောကြောင့် အယူအဆဆိုင်ရာ ပြောင်းလဲမှုတစ်ခုဖြစ်သည်။ ယင်းအစား သုတေသီသည် လူတစ်ဦးချင်းစီအား ဖြစ်နိုင်ချေရှိသော အဖြေများဖြစ်သည့်...
ပန်ဒါများကို အသုံးပြုရာတွင် သင်ကြုံတွေ့ရနိုင်သည့် အမှားတစ်ခုမှာ- ValueError : Can only compare identically-labeled DataFrame objects ပန်ဒါ DataFrames နှစ်ခုကို နှိုင်းယှဉ်ရန် ကြိုးစားသောအခါတွင် ဤအမှားသည် အညွှန်းတံဆိပ်များ သို့မဟုတ် ကော်လံတံဆိပ်များ လုံးဝကိုက်ညီမှုမရှိပါ။ အောက်ဖော်ပြပါ ဥပမာသည် ဤအမှားကို လက်တွေ့တွင် မည်သို့ပြုပြင်ရမည်ကို ပြသထားသည်။ အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။ ကျွန်ုပ်တို့တွင် အောက်ပါ Panda DataFrames နှစ်ခုရှိသည်ဟု ယူဆကြပါစို့။ import pandas as pd #define...