Category: လမ်းညွှန်
Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model တစ်ခုနှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့အသုံးပြုသည့် ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းတစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာတွင် လက်တွေ့ဘဝတွင် logistic regression ကိုအသုံးပြုခြင်း၏ မတူညီသောဥပမာလေးခုကို ပြသထားသည်။ Real Logistic Regression ဥပမာ #1 လေ့ကျင့်ခန်းနှင့် ကိုယ်အလေးချိန်သည် နှလုံးရောဂါဖြစ်နိုင်ခြေကို မည်ကဲ့သို့အကျိုးသက်ရောက်ကြောင်း ဆေးသုတေသီများက သိချင်ကြသည်။ ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်များနှင့် နှလုံးဖောက်နိုင်ခြေများကြား ဆက်နွယ်မှုကို နားလည်ရန် သုတေသီများသည် ထောက်လှမ်းဆုတ်ယုတ်မှုကို လုပ်ဆောင်နိုင်သည်။ မော်ဒယ်ရှိ တုံ့ပြန်မှုပြောင်းလဲမှုသည်...
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ z-score သည် စံနှုန်း တစ်ခုမှ တန်ဖိုးတစ်ခုသွေဖည်မှုမည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်- z = (X – μ) / σ ရွှေ- X သည် ဒေတာအကြမ်းတစ်ခုတည်းတန်ဖိုးဖြစ်သည်။ µ သည် လူဦးရေကို ဆိုလိုသည်။ σ သည် လူဦးရေစံသွေဖည်သည်။ ဤသင်ခန်းစာသည် Python ရှိ ဒေတာအကြမ်းတန်ဖိုးများအတွက် z-ရမှတ်များကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။ Python တွင် Z ရမှတ်များကို တွက်ချက်နည်း...
variable နှစ်ခုကြားရှိ ဆက်နွယ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုခြင်းဖြစ်ပြီး ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်စပ်မှုကို တိုင်းတာခြင်းဖြစ်ပါသည် ။ ၎င်းသည် အမြဲတမ်း -1 နှင့် 1 အကြား တန်ဖိုးတစ်ခုကို အမြဲယူပါသည်။ -1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပျက်သဘောဆောင်သော ဆက်စပ်ဆက်နွယ်မှုကို ညွှန်ပြသည်။ 0 သည် variable နှစ်ခုကြားတွင် linear ဆက်စပ်မှုမရှိဟု ညွှန်ပြသည်။ 1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပြုသဘောဆောင်သောမျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။ ဆက်စပ်ဆက်နွယ်မှုကိန်းဂဏန်းသည်...
စာရင်းဇယားများတွင်၊ ကျွန်ုပ်တို့သည် ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်နွယ်မှုကိုတိုင်းတာရန် Pearson ဆက်စပ်ကိန်းကို မကြာခဏအသုံးပြုသည်။ သို့သော်၊ တစ်ခါတစ်ရံတွင် ကျွန်ုပ်တို့သည် တတိယကိန်းရှင်တစ်ခုကို ထိန်းချုပ်နေစဉ်တွင် ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုကို နားလည်လိုပါသည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် အတန်းထဲတွင် ကျောင်းသား၏ လက်ရှိအတန်းကို ထိန်းချုပ်နေစဉ် ကျောင်းသားတစ်ဦး၏ စာကျက်ချိန်နာရီနှင့် နောက်ဆုံးစာမေးပွဲအဆင့်ကြား ဆက်စပ်မှုကို တိုင်းတာလိုသည်ဆိုပါစို့။ ဤကိစ္စတွင်၊ လေ့လာခဲ့သည့် နာရီနှင့် နောက်ဆုံးစာမေးပွဲအဆင့်ကြား ဆက်နွယ်မှုကို တိုင်းတာရန် တစ်စိတ်တစ်ပိုင်းဆက်စပ်မှုကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။ ဤသင်ခန်းစာတွင် Python တွင် တစ်စိတ်တစ်ပိုင်းဆက်စပ်မှုကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။...
variable နှစ်ခုကြားရှိ ဆက်နွယ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုခြင်းဖြစ်ပြီး ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်စပ်မှုကို တိုင်းတာခြင်းဖြစ်ပါသည် ။ ၎င်းသည် -1 နှင့် 1 ကြားရှိတန်ဖိုးကို ယူသည်- -1 သည် လုံးဝအနုတ်လက္ခဏာ မျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။ 0 သည် linear ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြသည်။ 1 သည် လုံးဝအပြုသဘောဆောင်သော linear ဆက်စပ်မှုကို ညွှန်ပြသည်။ ဆက်စပ်ဆက်နွယ်မှုကိန်းဂဏန်းသည် သုညမှဖြစ်ပြီး၊ ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုအားကောင်းလေဖြစ်သည်။ သို့သော်...
Covariance သည် ကိန်းရှင်တစ်ခုရှိ ပြောင်းလဲမှုများနှင့် ဒုတိယကိန်းရှင်တစ်ခုရှိ အပြောင်းအလဲများနှင့် ဆက်စပ်နေပုံကို တိုင်းတာခြင်းဖြစ်သည်။ ပို၍တိကျသည်မှာ၊ ၎င်းသည် ကိန်းရှင်နှစ်ခုအား မျဉ်းသားဆက်စပ်နေသည့်အတိုင်းအတာကို တိုင်းတာခြင်းဖြစ်သည်။ covariance matrix သည် မတူညီသော variable များစွာကြားတွင် ကွဲလွဲမှုကိုပြသသော စတုရန်း matrix တစ်ခုဖြစ်သည်။ ၎င်းသည် ဒေတာအတွဲတစ်ခုတွင် မတူညီသော variable များ မည်သို့ဆက်စပ်ကြောင်း နားလည်ရန် အသုံးဝင်သောနည်းလမ်းတစ်ခုဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် Python တွင် ကွဲပြားသည့် matrix တစ်ခုကို ဖန်တီးနည်းကို ပြသထားသည်။ Python...
Outlier သည် ဒေတာအတွဲတစ်ခုရှိ အခြားတန်ဖိုးများနှင့် ပုံမှန်မဟုတ်စွာ ဝေးကွာနေသော စူးစမ်းမှုတစ်ခုဖြစ်သည်။ ခွဲခြမ်းစိတ်ဖြာမှု၏ရလဒ်များကို ထိခိုက်စေနိုင်သောကြောင့် အစွန်းထွက်သူများသည် ပြဿနာရှိနိုင်သည်။ ဤသင်ခန်းစာတွင် Python ရှိ အစွန်းအထင်းများကို ခွဲခြားသတ်မှတ်ပြီး ဖယ်ရှားနည်းကို ရှင်းပြထားသည်။ Python တွင် Outliers ကိုမည်သို့ခွဲခြားနိုင်မည်နည်း။ အစွန်းကွက်များကို ဖယ်ရှားခြင်းမပြုမီ၊ သင်သည် အစွန်းထွက်တစ်ခုဟု သင်ယူဆသောအရာကို ဦးစွာဆုံးဖြတ်ရပါမည်။ ဒီလိုလုပ်ဖို့ ဘုံနည်းလမ်းနှစ်ခုရှိပါတယ် 1. ကြားကာလအပိုင်းအခြားကို အသုံးပြုပါ။ interquartile အကွာအဝေး (IQR) သည် ဒေတာအတွဲတစ်ခုတွင် 75th ရာခိုင်နှုန်း (Q3)...
Mahalanobis အကွာအဝေး သည် အမျိုးမျိုးကွဲပြားသောနေရာတစ်ခုရှိ အမှတ်နှစ်ခုကြားအကွာအဝေးဖြစ်သည်။ ကိန်းရှင်များစွာပါ၀င်သော စာရင်းအင်းခွဲခြမ်းစိတ်ဖြာမှုတွင် အစွန်းထွက်များကို ရှာဖွေရန် ၎င်းကို မကြာခဏအသုံးပြုသည်။ ဤသင်ခန်းစာတွင် Python ရှိ Mahalanobis အကွာအဝေးကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။ ဥပမာ- Python ရှိ Mahalanobis အကွာအဝေး Python ရှိ ဒေတာအတွဲတစ်ခုတွင် ကြည့်ရှုမှုတစ်ခုစီအတွက် Mahalanobis အကွာအဝေးကို တွက်ချက်ရန် အောက်ပါအဆင့်များကို အသုံးပြုပါ။ အဆင့် 1: ဒေတာအတွဲကို ဖန်တီးပါ။ ပထမဦးစွာ၊ ကျောင်းသား 20 ၏ စာမေးပွဲရမှတ်များကို...
binomial distribution သည် စာရင်းဇယားများတွင် အသုံးအများဆုံး ဖြန့်ဝေမှုများထဲမှ တစ်ခုဖြစ်သည်။ ၎င်းသည် n binomial စမ်းသပ်မှုများတွင် k အောင်မြင်မှုများရရှိရန် ဖြစ်နိုင်ခြေကို ဖော်ပြသည်။ ကျပန်း variable X သည် binomial distribution ကို လိုက်နာပါက၊ X = k အောင်မြင်မှု ဖြစ်နိုင်ခြေကို အောက်ပါဖော်မြူလာဖြင့် ရှာတွေ့နိုင်သည်- P(X=k) = n C k * p k * (1-p) nk...
ogive သည် ဒေတာအတွဲတစ်ခုတွင် ဒေတာတန်ဖိုး မည်မျှတန်ဖိုးများ အထက် သို့မဟုတ် အောက်တွင် မည်မျှကျဆင်းသည်ကို ပြသသည့် ဂရပ်ဖစ်တစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာတွင် Python တွင် ထိပ်ဖူးဖန်တီးနည်းကို ရှင်းပြထားသည်။ ဥပမာ- Python တွင် Ogive ဖန်တီးနည်း Python ရှိ ဒေတာအစုံအတွက် ogive ဖန်တီးရန် အောက်ပါအဆင့်များကို ပြီးအောင်လုပ်ပါ။ အဆင့် 1- ဒေတာအတွဲတစ်ခု ဖန်တီးပါ။ ပထမဦးစွာ ကျွန်ုပ်တို့သည် ရိုးရှင်းသောဒေတာအတွဲတစ်ခုကို ဖန်တီးနိုင်သည်။ import numpy as np #create...