Category: လမ်းညွှန်

ဖြစ်နိုင်ခြေ vs. အချိုးအစား- ကွာခြားချက်ကဘာလဲ။

စာရင်းဇယားများတွင် ကျောင်းသားများ မကြာခဏ ရောထွေးနေသော ဝေါဟာရနှစ်ခုမှာ ဖြစ်နိုင်ခြေ နှင့် အချိုးအစား ဖြစ်သည်။ ဤတွင် ကွာခြားချက်မှာ- ဖြစ်နိုင်ခြေသည် အဖြစ်အပျက်တစ်ခု၏ အခွင့်အလမ်းများကို ကိုယ်စားပြုသည်။ အဲဒါ သီအိုရီပါ ။ အချိုးအစားသည် ဖြစ်ရပ်တစ်ခု အမှန်တကယ် ဖြစ်ပွားသည့် အကြိမ်အရေအတွက်ကို အကျဉ်းချုပ်ဖော်ပြသည်။ ဒါဟာ အင်ပါယာပဲ ။ ကျွန်ုပ်တို့သည် အနာဂတ်တွင် ဖြစ်ပျက်မည့် အဖြစ်အပျက်တစ်ခု ဖြစ်နိုင်ခြေများကို ပြောဆိုရန် ဖြစ်နိုင်ခြေကို မကြာခဏ အသုံးပြုပါသည်။ ဆန့်ကျင်ဘက်အားဖြင့်၊ ကျွန်ုပ်တို့သည် အတိတ်တွင် အမှန်တကယ်ဖြစ်ပျက်ခဲ့သည့် အကြိမ်အရေအတွက်ကို...

ဆွေမျိုးအန္တရာယ်အတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်နည်း

အောက်ပါဖော်မတ်ကိုယူသည့် 2×2 ဇယားကို ခွဲခြမ်းစိတ်ဖြာသည့်အခါ ဆက်စပ်အန္တရာယ်ကို မကြာခဏ တွက်ချက်သည်- ဆက်စပ်အန္တရာယ်သည် ထိန်းချုပ်မှုအုပ်စုတွင် ဖြစ်ပွားသည့် ဖြစ်ရပ်တစ်ခု၏ ဖြစ်နိုင်ခြေနှင့် နှိုင်းယှဉ်ပါက ကုသမှုအုပ်စုတစ်ခုတွင် အဖြစ်အပျက်တစ်ခု ဖြစ်ပွားနိုင်ခြေကို ပြောပြသည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ ဆက်စပ်အန္တရာယ် = [A/(A+B)] / [C/(C+D)] ထို့နောက် ကျွန်ုပ်တို့သည် ဆွေမျိုးအန္တရာယ် (RR) အတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုနိုင်ပါသည်။ CI ထက်နည်းသော 95% = e ln(RR) – 1.96√...

အသက်သည် ကြားကာလ သို့မဟုတ် အချိုးပြောင်းနိုင်ပါသလား။ (ရှင်းလင်းချက်နှင့် ဥပမာ)

စာရင်းဇယားများတွင်၊ ကိန်းရှင်အားလုံးကို တိုင်းတာမှုစကေးလေးခုအနက်တစ်ခုပေါ်တွင် တိုင်းတာသည်- Nominal : အရေအတွက်တန်ဖိုးများ မရှိသော ကိန်းရှင်များ။ Ordinal : သဘာဝအစီအစဥ်ရှိသော်လည်း တန်ဖိုးများကြားတွင် အရေအတွက် ကွာခြားချက်မရှိပါ။ ကြားကာလ – သဘာဝအစီအစဥ်တစ်ခုနှင့် တန်ဖိုးများအကြား အတိုင်းအတာတစ်ခုအထိ ခြားနားချက်ရှိသော်လည်း “စစ်မှန်သောသုည” တန်ဖိုးမရှိပါ။ အချိုးအစား – သဘာဝအစီအစဥ်တစ်ခု၊ တန်ဖိုးများအကြား ကိန်းဂဏန်းခြားနားချက်နှင့် “ စစ်မှန်သော သုည” တန်ဖိုးရှိသော ကိန်းရှင်များ။ အောက်ပါဂရပ်သည် ဤမတူညီသောတိုင်းတာမှုအဆင့်များကို အကျဉ်းချုပ်ဖော်ပြသည်- ကျောင်းသားတွေ မေးလေ့ရှိတဲ့ မေးခွန်းတစ်ခုကတော့ “ အသက်”...

နမူနာကွဲလွဲမှု vs. လူဦးရေကွဲပြားမှု- ကွာခြားချက်ကား အဘယ်နည်း။

Variance သည် data set တစ်ခုတွင် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။ လူဦးရေကွဲလွဲမှုကို တွက်ချက်ရန် ဖော်မြူလာမှာ- σ 2 = Σ (x i – μ) 2 / N ရွှေ- ∑ : “ပေါင်း” ဟူသော သင်္ကေတ၊ μ : လူဦးရေ ပျမ်းမျှ x i : လူဦးရေ၏ i th ဒြပ်စင် N...

စဉ်ဆက်မပြတ်ကွဲလွဲမှု အယူအဆ- အဓိပ္ပါယ်နှင့် ဥပမာ

Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို တွက်ချက်ရန် ကျွန်ုပ်တို့အသုံးပြုသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ မျဉ်းကြောင်းပြန်ဆုတ်ခြင်း၏ အဓိကယူဆချက်တစ်ခုသည် အကြွင်းအကျန်များသည် ကြိုတင်ခန့်မှန်းကိန်းရှင်ကိန်းရှင်အဆင့်တစ်ခုစီတွင် အဆက်မပြတ်ကွဲလွဲနေခြင်းဖြစ်သည်။ ဤယူဆချက်အား အတည်မပြုပါက ကျန်လူများသည် မျိုးကွဲကွဲပြားမှု ဒဏ်ကို ခံစားကြရမည်ဖြစ်သည်။ ထိုသို့ဖြစ်လာသောအခါ၊ မော်ဒယ်၏ကိန်းဂဏန်းခန့်မှန်းချက်သည် ယုံကြည်စိတ်ချရခြင်းမရှိပါ။ အဆက်မပြတ်ကွဲလွဲမှုကို အကဲဖြတ်နည်း ဆုတ်ယုတ်မှုပုံစံတစ်ခု၏ ကျန်ကြွင်းသောအရာများသည် အဆက်မပြတ်ကွဲလွဲမှုရှိမရှိကို ဆုံးဖြတ်ရန် အသုံးအများဆုံးနည်းလမ်းမှာ အကြွင်းအကျန်များနှင့် အံဝင်ခွင်ကျရှိသော တန်ဖိုးများကို ဖန်တီးရန်ဖြစ်သည်။ ၎င်းသည် x-ဝင်ရိုးတစ်လျှောက် ဆုတ်ယုတ်မှုပုံစံ၏...

ပြီးပြည့်စုံသောလမ်းညွှန်- odds ratios ကို မည်သို့အစီရင်ခံမည်နည်း။

စာရင်းဇယားများတွင်၊ odds ratio သည် ကုသမှုအုပ်စုတစ်ခုတွင် ဖြစ်ပျက်နေသော အဖြစ်အပျက်တစ်ခု၏ မသာမယာအချိုးအစားကို ထိန်းချုပ်သည့်အုပ်စုတွင် ဖြစ်ပျက်နေသည့် အဖြစ်အပျက်တစ်ခု၏ မသာမယာများနှင့် အချိုးကို ပြောပြသည်။ အချိုးမညီမှုတစ်ခုကို ကျွန်ုပ်တို့အစီရင်ခံသောအခါ၊ ကျွန်ုပ်တို့သည် ပုံမှန်အားဖြင့် အောက်ပါတို့ကို ထည့်သွင်းသည်- အချိုးမညီသောတန်ဖိုး အလေးသာအချိုးအတွက် ယုံကြည်မှုကြားကာလ ပြဿနာ၏ဆက်စပ်နေသော မသာမယာအချိုးကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ ဥပမာအားဖြင့်၊ ဤကဲ့သို့သောအရာတစ်ခုကို ကျွန်ုပ်တို့ အစီရင်ခံနိုင်သည်- ဆေးလိပ်သောက်ခြင်းနှင့် ဆေးလိပ်မသောက်သောအုပ်စုများကြားတွင် မည်သည့်ရောဂါကူးစက်နိုင်ခြေများ (OR = 1.44၊ 95% CI [0.91၊ 1.97])။ မှတ်ချက်...

လမ်းညွှန်ချက်အပြည့်အစုံ- ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုရလဒ်များကို မည်သို့အစီရင်ခံမည်နည်း။

Logistic regression သည် response variable binary ဖြစ်သောအခါ ကျွန်ုပ်တို့အသုံးပြုသည့် regression analysis အမျိုးအစားတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏ ရလဒ်များကို အစီရင်ခံရန် အောက်ပါ အထွေထွေဖော်မတ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။ Logistic regression ကို [predictor variable 1]၊ [predictor variable 2]၊…[predictor variable n ] နှင့် [response variable] အကြား ဆက်စပ်မှုကို ပိုင်းခြားစိတ်ဖြာရန် အသုံးပြုပါသည်။ အခြားကြိုတင်ခန့်မှန်းကိန်းရှင်များအားလုံးကို အဆက်မပြတ်ကိုင်ဆောင်ထားခြင်းဖြင့်၊ တစ်ယူနစ်တစ်ခုတိုးလာရန်အတွက်...

ဘယ်အချိန်မှာ polynomial regression ကိုသုံးသင့်သလဲ။

Polynomial regression သည် ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) နှင့် တုံ့ပြန်မှုကိန်းရှင်သည် linear မဟုတ်သည့်အခါ ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံဝင်ခွင်ကျဖြစ်စေရန်အတွက် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ polynomial regression model သည် အောက်ပါပုံစံကို ယူပါသည်။ Y = β 0 + β 1 X + β 2 X 2 + … + β h လက်တွေ့တွင်၊ linear regression ကဲ့သို့သော ရိုးရှင်းသောပုံစံနှင့်...

Conceptual variable ဆိုတာ ဘာလဲ။ (အဓိပ္ပါယ်နှင့် ဥပမာများ)

စာရင်းဇယားများတွင်၊ သဘောတရားဆိုင်ရာ ကိန်းရှင်သည် ကျွန်ုပ်တို့တိုင်းတာလိုသည့် တည်ဆောက်မှု သို့မဟုတ် စိတ္တဇအရာတစ်ခုကို ကိုယ်စားပြုသည်။ သို့သော်၊ ကျွန်ုပ်တို့သည် သဘောတရားဆိုင်ရာ ကိန်းရှင်ကို တိုက်ရိုက်တိုင်းတာခြင်းမပြုနိုင်ပါ၊ ထို့ကြောင့် ကျွန်ုပ်တို့သည် သဘောတရားဆိုင်ရာ ကိန်းရှင်ကို အရေအတွက်သတ်မှတ်ရန် အမှန်တကယ်တိုင်းတာမှုကို အသုံးပြုပါသည်။ ဥပမာအားဖြင့်၊ သုတေသီတစ်ဦးသည် တစ်ဦးချင်းစီ၏ “ အလုံးစုံပျော်ရွှင်မှု” ကို အကဲဖြတ်လိုသည်ဆိုပါစို့။ ဤသည်မှာ လူတစ်ဦးချင်းစီအား “ အလုံးစုံပျော်ရွှင်မှု” တန်ဖိုးကို တိုက်ရိုက်သတ်မှတ်ရန် နည်းလမ်းမရှိသောကြောင့် အယူအဆဆိုင်ရာ ပြောင်းလဲမှုတစ်ခုဖြစ်သည်။ ယင်းအစား သုတေသီသည် လူတစ်ဦးချင်းစီအား ဖြစ်နိုင်ချေရှိသော အဖြေများဖြစ်သည့်...

ပြုပြင်နည်း- တူညီသောတံဆိပ်တပ်ထားသော အမှတ်စဉ်အရာဝတ္ထုများကိုသာ နှိုင်းယှဉ်နိုင်သည်။

ပန်ဒါများကို အသုံးပြုရာတွင် သင်ကြုံတွေ့ရနိုင်သည့် အမှားတစ်ခုမှာ- ValueError : Can only compare identically-labeled DataFrame objects ပန်ဒါ DataFrames နှစ်ခုကို နှိုင်းယှဉ်ရန် ကြိုးစားသောအခါတွင် ဤအမှားသည် အညွှန်းတံဆိပ်များ သို့မဟုတ် ကော်လံတံဆိပ်များ လုံးဝကိုက်ညီမှုမရှိပါ။ အောက်ဖော်ပြပါ ဥပမာသည် ဤအမှားကို လက်တွေ့တွင် မည်သို့ပြုပြင်ရမည်ကို ပြသထားသည်။ အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။ ကျွန်ုပ်တို့တွင် အောက်ပါ Panda DataFrames နှစ်ခုရှိသည်ဟု ယူဆကြပါစို့။ import pandas as pd #define...