Category: လမ်းညွှန်

4 လက်တွေ့ဘဝတွင် logistic regression ကိုအသုံးပြုခြင်း၏နမူနာများ

Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model တစ်ခုနှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့အသုံးပြုသည့် ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းတစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာတွင် လက်တွေ့ဘဝတွင် logistic regression ကိုအသုံးပြုခြင်း၏ မတူညီသောဥပမာလေးခုကို ပြသထားသည်။ Real Logistic Regression ဥပမာ #1 လေ့ကျင့်ခန်းနှင့် ကိုယ်အလေးချိန်သည် နှလုံးရောဂါဖြစ်နိုင်ခြေကို မည်ကဲ့သို့အကျိုးသက်ရောက်ကြောင်း ဆေးသုတေသီများက သိချင်ကြသည်။ ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်များနှင့် နှလုံးဖောက်နိုင်ခြေများကြား ဆက်နွယ်မှုကို နားလည်ရန် သုတေသီများသည် ထောက်လှမ်းဆုတ်ယုတ်မှုကို လုပ်ဆောင်နိုင်သည်။ မော်ဒယ်ရှိ တုံ့ပြန်မှုပြောင်းလဲမှုသည်...

Python တွင် z ရမှတ်များကို တွက်ချက်နည်း

ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ z-score သည် စံနှုန်း တစ်ခုမှ တန်ဖိုးတစ်ခုသွေဖည်မှုမည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်- z = (X – μ) / σ ရွှေ- X သည် ဒေတာအကြမ်းတစ်ခုတည်းတန်ဖိုးဖြစ်သည်။ µ သည် လူဦးရေကို ဆိုလိုသည်။ σ သည် လူဦးရေစံသွေဖည်သည်။ ဤသင်ခန်းစာသည် Python ရှိ ဒေတာအကြမ်းတန်ဖိုးများအတွက် z-ရမှတ်များကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။ Python တွင် Z ရမှတ်များကို တွက်ချက်နည်း...

Python တွင် ဆက်စပ်မှုကို တွက်ချက်နည်း

variable နှစ်ခုကြားရှိ ဆက်နွယ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုခြင်းဖြစ်ပြီး ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်စပ်မှုကို တိုင်းတာခြင်းဖြစ်ပါသည် ။ ၎င်းသည် အမြဲတမ်း -1 နှင့် 1 အကြား တန်ဖိုးတစ်ခုကို အမြဲယူပါသည်။ -1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပျက်သဘောဆောင်သော ဆက်စပ်ဆက်နွယ်မှုကို ညွှန်ပြသည်။ 0 သည် variable နှစ်ခုကြားတွင် linear ဆက်စပ်မှုမရှိဟု ညွှန်ပြသည်။ 1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပြုသဘောဆောင်သောမျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။ ဆက်စပ်ဆက်နွယ်မှုကိန်းဂဏန်းသည်...

Python တွင် တစ်စိတ်တစ်ပိုင်းဆက်စပ်မှုကို တွက်ချက်နည်း

စာရင်းဇယားများတွင်၊ ကျွန်ုပ်တို့သည် ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်နွယ်မှုကိုတိုင်းတာရန် Pearson ဆက်စပ်ကိန်းကို မကြာခဏအသုံးပြုသည်။ သို့သော်၊ တစ်ခါတစ်ရံတွင် ကျွန်ုပ်တို့သည် တတိယကိန်းရှင်တစ်ခုကို ထိန်းချုပ်နေစဉ်တွင် ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုကို နားလည်လိုပါသည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် အတန်းထဲတွင် ကျောင်းသား၏ လက်ရှိအတန်းကို ထိန်းချုပ်နေစဉ် ကျောင်းသားတစ်ဦး၏ စာကျက်ချိန်နာရီနှင့် နောက်ဆုံးစာမေးပွဲအဆင့်ကြား ဆက်စပ်မှုကို တိုင်းတာလိုသည်ဆိုပါစို့။ ဤကိစ္စတွင်၊ လေ့လာခဲ့သည့် နာရီနှင့် နောက်ဆုံးစာမေးပွဲအဆင့်ကြား ဆက်နွယ်မှုကို တိုင်းတာရန် တစ်စိတ်တစ်ပိုင်းဆက်စပ်မှုကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။ ဤသင်ခန်းစာတွင် Python တွင် တစ်စိတ်တစ်ပိုင်းဆက်စပ်မှုကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။...

Python တွင် correlation matrix ကိုဖန်တီးနည်း

variable နှစ်ခုကြားရှိ ဆက်နွယ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုခြင်းဖြစ်ပြီး ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်စပ်မှုကို တိုင်းတာခြင်းဖြစ်ပါသည် ။ ၎င်းသည် -1 နှင့် 1 ကြားရှိတန်ဖိုးကို ယူသည်- -1 သည် လုံးဝအနုတ်လက္ခဏာ မျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။ 0 သည် linear ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြသည်။ 1 သည် လုံးဝအပြုသဘောဆောင်သော linear ဆက်စပ်မှုကို ညွှန်ပြသည်။ ဆက်စပ်ဆက်နွယ်မှုကိန်းဂဏန်းသည် သုညမှဖြစ်ပြီး၊ ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုအားကောင်းလေဖြစ်သည်။ သို့သော်...

Python တွင် covariance matrix ဖန်တီးနည်း

Covariance သည် ကိန်းရှင်တစ်ခုရှိ ပြောင်းလဲမှုများနှင့် ဒုတိယကိန်းရှင်တစ်ခုရှိ အပြောင်းအလဲများနှင့် ဆက်စပ်နေပုံကို တိုင်းတာခြင်းဖြစ်သည်။ ပို၍တိကျသည်မှာ၊ ၎င်းသည် ကိန်းရှင်နှစ်ခုအား မျဉ်းသားဆက်စပ်နေသည့်အတိုင်းအတာကို တိုင်းတာခြင်းဖြစ်သည်။ covariance matrix သည် မတူညီသော variable များစွာကြားတွင် ကွဲလွဲမှုကိုပြသသော စတုရန်း matrix တစ်ခုဖြစ်သည်။ ၎င်းသည် ဒေတာအတွဲတစ်ခုတွင် မတူညီသော variable များ မည်သို့ဆက်စပ်ကြောင်း နားလည်ရန် အသုံးဝင်သောနည်းလမ်းတစ်ခုဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် Python တွင် ကွဲပြားသည့် matrix တစ်ခုကို ဖန်တီးနည်းကို ပြသထားသည်။ Python...

Python ရှိ outliers ကိုမည်သို့ဖယ်ရှားနည်း

Outlier သည် ဒေတာအတွဲတစ်ခုရှိ အခြားတန်ဖိုးများနှင့် ပုံမှန်မဟုတ်စွာ ဝေးကွာနေသော စူးစမ်းမှုတစ်ခုဖြစ်သည်။ ခွဲခြမ်းစိတ်ဖြာမှု၏ရလဒ်များကို ထိခိုက်စေနိုင်သောကြောင့် အစွန်းထွက်သူများသည် ပြဿနာရှိနိုင်သည်။ ဤသင်ခန်းစာတွင် Python ရှိ အစွန်းအထင်းများကို ခွဲခြားသတ်မှတ်ပြီး ဖယ်ရှားနည်းကို ရှင်းပြထားသည်။ Python တွင် Outliers ကိုမည်သို့ခွဲခြားနိုင်မည်နည်း။ အစွန်းကွက်များကို ဖယ်ရှားခြင်းမပြုမီ၊ သင်သည် အစွန်းထွက်တစ်ခုဟု သင်ယူဆသောအရာကို ဦးစွာဆုံးဖြတ်ရပါမည်။ ဒီလိုလုပ်ဖို့ ဘုံနည်းလမ်းနှစ်ခုရှိပါတယ် 1. ကြားကာလအပိုင်းအခြားကို အသုံးပြုပါ။ interquartile အကွာအဝေး (IQR) သည် ဒေတာအတွဲတစ်ခုတွင် 75th ရာခိုင်နှုန်း (Q3)...

Python ရှိ mahalanobis အကွာအဝေးကို တွက်နည်း

Mahalanobis အကွာအဝေး သည် အမျိုးမျိုးကွဲပြားသောနေရာတစ်ခုရှိ အမှတ်နှစ်ခုကြားအကွာအဝေးဖြစ်သည်။ ကိန်းရှင်များစွာပါ၀င်သော စာရင်းအင်းခွဲခြမ်းစိတ်ဖြာမှုတွင် အစွန်းထွက်များကို ရှာဖွေရန် ၎င်းကို မကြာခဏအသုံးပြုသည်။ ဤသင်ခန်းစာတွင် Python ရှိ Mahalanobis အကွာအဝေးကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။ ဥပမာ- Python ရှိ Mahalanobis အကွာအဝေး Python ရှိ ဒေတာအတွဲတစ်ခုတွင် ကြည့်ရှုမှုတစ်ခုစီအတွက် Mahalanobis အကွာအဝေးကို တွက်ချက်ရန် အောက်ပါအဆင့်များကို အသုံးပြုပါ။ အဆင့် 1: ဒေတာအတွဲကို ဖန်တီးပါ။ ပထမဦးစွာ၊ ကျောင်းသား 20 ၏ စာမေးပွဲရမှတ်များကို...

Python တွင် binomial distribution ကိုအသုံးပြုနည်း

binomial distribution သည် စာရင်းဇယားများတွင် အသုံးအများဆုံး ဖြန့်ဝေမှုများထဲမှ တစ်ခုဖြစ်သည်။ ၎င်းသည် n binomial စမ်းသပ်မှုများတွင် k အောင်မြင်မှုများရရှိရန် ဖြစ်နိုင်ခြေကို ဖော်ပြသည်။ ကျပန်း variable X သည် binomial distribution ကို လိုက်နာပါက၊ X = k အောင်မြင်မှု ဖြစ်နိုင်ခြေကို အောက်ပါဖော်မြူလာဖြင့် ရှာတွေ့နိုင်သည်- P(X=k) = n C k * p k * (1-p) nk...

Python တွင် ogive chart ဖန်တီးနည်း

ogive သည် ဒေတာအတွဲတစ်ခုတွင် ဒေတာတန်ဖိုး မည်မျှတန်ဖိုးများ အထက် သို့မဟုတ် အောက်တွင် မည်မျှကျဆင်းသည်ကို ပြသသည့် ဂရပ်ဖစ်တစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာတွင် Python တွင် ထိပ်ဖူးဖန်တီးနည်းကို ရှင်းပြထားသည်။ ဥပမာ- Python တွင် Ogive ဖန်တီးနည်း Python ရှိ ဒေတာအစုံအတွက် ogive ဖန်တီးရန် အောက်ပါအဆင့်များကို ပြီးအောင်လုပ်ပါ။ အဆင့် 1- ဒေတာအတွဲတစ်ခု ဖန်တီးပါ။ ပထမဦးစွာ ကျွန်ုပ်တို့သည် ရိုးရှင်းသောဒေတာအတွဲတစ်ခုကို ဖန်တီးနိုင်သည်။ import numpy as np #create...