Category: လမ်းညွှန်

Pandas တွင် keyerror ကိုမည်သို့ဖြေရှင်းနည်း (ဥပမာနှင့်အတူ)

ပန်ဒါများကို အသုံးပြုရာတွင် သင်ကြုံတွေ့ရနိုင်သည့် အမှားတစ်ခုမှာ- KeyError : 'column_name' မရှိသောပန်ဒါ DataFrame ကော်လံတစ်ခုကို သင်ဝင်ရောက်ရန်ကြိုးစားသောအခါ ဤအမှားဖြစ်ပေါ်ပါသည်။ ပုံမှန်အားဖြင့်၊ သင်သည် ကော်လံအမည်ကို ရိုးရိုးစာလုံးပေါင်းမှားခြင်း သို့မဟုတ် ကော်လံအမည်ရှေ့ သို့မဟုတ် နောက်တွင် မတော်တဆနေရာတစ်ခု ထည့်သွင်းသည့်အခါတွင် ဤအမှားဖြစ်ပေါ်ပါသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤအမှားကို လက်တွေ့တွင် မည်သို့ပြုပြင်ရမည်ကို ပြသထားသည်။ အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။ ကျွန်ုပ်တို့သည် အောက်ပါ ပန်ဒါ DataFrame ကို ဖန်တီးသည်ဆိုပါစို့။ import pandas as pd...

Logistic regression အမျိုးအစား ၃ မျိုး (ဥပမာများ အပါအဝင်)

Logistic regression သည် တုံ့ပြန်မှု မပြောင်းလဲနိုင်သော အမျိုးအစားအလိုက် ဆုတ်ယုတ်မှုပုံစံကို ရည်ညွှန်းသည်။ Logistic regression model အမျိုးအစားသုံးမျိုး ရှိပါသည်။ Binary logistic regression : တုံ့ပြန်မှု variable သည် အမျိုးအစားနှစ်ခုထဲမှ တစ်ခုသာ သက်ဆိုင်ပါသည်။ Multinomial logistic regression : တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားသုံးမျိုး သို့မဟုတ် ထို့ထက်ပိုသော အမျိုးအစားများထဲမှ တစ်ခုသို့ ကျဆင်းနိုင်ပြီး အမျိုးအစားများကြားတွင် သဘာဝအတိုင်း စီစဥ်ထားခြင်းမရှိပါ။ Ordinal logistic regression :...

Logistic regression vs linear regression- အဓိကကွာခြားချက်များ

အသုံးအများဆုံး ဆုတ်ယုတ်မှုပုံစံ နှစ်ခုမှာ linear regression နှင့် logistic regression ဖြစ်သည်။ ဆုတ်ယုတ်မှုပုံစံနှစ်မျိုးစလုံးကို ခန့်မှန်းတွက်ချက်နိုင်သောကိန်းရှင်တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို အရေအတွက်သတ်မှတ်ရန်အတွက် အသုံးပြုသော်လည်း မော်ဒယ်နှစ်ခုကြားတွင် အဓိကကွာခြားချက်အနည်းငယ်ရှိပါသည်- ဤသည်မှာ ကွဲပြားမှုများ၏ အကျဉ်းချုပ်ဖြစ်သည်။ ကွာခြားချက် #1- တုံ့ပြန်မှု Variable အမျိုးအစား တုံ့ပြန်မှုကိန်းရှင်သည် ထိုကဲ့သို့သော စဉ်ဆက်မပြတ်တန်ဖိုးကို ယူသောအခါ မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံကို အသုံးပြုသည်- စျေးနှုန်း အရပ်အမြင့် အသက် အကွာအဝေး အပြန်အလှန်အားဖြင့်၊ တုံ့ပြန်မှုကိန်းရှင်သည်...

R တွင် italic font ကိုအသုံးပြုနည်း (ဥပမာများနှင့်အတူ)

R ကွက်များတွင် စာလုံးစောင်းစာလုံးတစ်ခုထုတ်လုပ်ရန် အောက်ပါအခြေခံအထားအသိုကိုသုံးနိုင်သည်။ substitute(paste(italic(' this text is italic '))) အောက်ပါဥပမာများသည် ဤ syntax ကိုလက်တွေ့တွင်မည်သို့အသုံးပြုရမည်ကိုပြသထားသည်။ ဥပမာ 1- ကွက်ကွက်ခေါင်းစဉ်ရှိ စာလုံးစောင်း အောက်ပါကုဒ်သည် R ရှိကွက်တစ်ခု၏ခေါင်းစဉ်တွင် စာလုံးစောင်းစာလုံးကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်- #define data x <- c(1, 2, 3, 4, 4, 5, 6, 6, 7, 9) y <- c(8,...

R တွင် ပြုပြင်နည်း- အခြေအနေသည် အရှည် > 1 ရှိပြီး ပထမဒြပ်စင်ကိုသာ အသုံးပြုပါမည်။

R တွင် သင်ကြုံတွေ့ရသော အမှားတစ်ခုမှာ- Warning message: In if (x > 1) {: the condition has length > 1 and only the first element will be used အခြေအနေတစ်ခုစစ်ဆေးရန် if() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုရန် ကြိုးပမ်းသောအခါတွင် ဤအမှားသည် ဖြစ်ပေါ်တတ်သော်လည်း၊ သင်တစ်ဦးချင်းစီဒြပ်စင်များအစား if() လုပ်ဆောင်ချက်သို့ ပေးပို့ပါသည်။ ဤသင်ခန်းစာတွင် ဤအမှားကို မည်သို့ပြင်ရမည်ကို တိတိကျကျ...

ပြင်ဆင်နည်း- plot.new(): ကိန်းဂဏန်းအနားသတ်များ ကြီးလွန်းသော အမှား

R တွင် သင်ကြုံတွေ့ရသော အမှားတစ်ခုမှာ- Error in plot.new(): figure margins too large RStudio ရှိ ကွက်ကွက်အကန့်သည် သင်ဖန်တီးရန်ကြိုးစားနေသည့် ကွက်ကွက်၏အနားသတ်များအတွက် သေးငယ်လွန်းသောအခါတွင် ဤအမှားဖြစ်ပေါ်ပါသည်။ ဤသင်ခန်းစာတွင် ဤအမှားကို မည်သို့ပြင်ရမည်ကို တိတိကျကျ ရှင်းပြထားသည်။ အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။ R တွင် အောက်ပါဇာတ်ကွက်ကို ဖန်တီးရန် ကြိုးစားသည်ဆိုပါစို့။ #attempt to create scatterplot plot(1:30) ကျွန်ုပ်တို့သည် အောက်ပါအမှားကို လက်ခံရရှိသည်- Error in plot.new():...

R- အမျိုးအစား "ပိတ်ခြင်း" ၏ အရာဝတ္တုကို မည်သို့ကိုင်တွယ်ရမည်ကို အတိအကျ မသတ်မှတ်နိုင်ပါ။

R တွင် သင်ကြုံတွေ့ရသော အမှားတစ်ခုမှာ- object of type 'closure' is not subsettable လုပ်ဆောင်ချက်တစ်ခုကို ခွဲသတ်မှတ်ရန် သင်ကြိုးစားသောအခါတွင် ဤအမှားဖြစ်ပေါ်ပါသည်။ R တွင် စာရင်းခွဲများ၊ vectors၊ matrices နှင့် data frames များကို ခွဲထားနိုင်သော်လည်း function တစ်ခုတွင် အမျိုးအစားခွဲ၍မရသော “ close” ပါရှိပါသည်။ ဤအမှားအယွင်းကို ဖြေရှင်းနည်းကို ဤသင်ခန်းစာတွင် အတိအကျ ရှင်းပြထားသည်။ အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။ Vector တစ်ခုစီ၏တန်ဖိုးတစ်ခုစီကိုယူ၍ 5...

ပြင်ဆင်နည်း- randomforest.default(m, y, …): နိုင်ငံခြား လုပ်ဆောင်ချက်ခေါ်ဆိုမှုတွင် na/nan/inf

R တွင် သင်ကြုံတွေ့နိုင်သော အမှားတစ်ခုမှာ- Error in randomForest.default(m, y, ...): NA/NaN/Inf in foreign function call (arg 1) ဤအမှားသည် အကြောင်းရင်းနှစ်ခုကြောင့် ဖြစ်နိုင်သည်- ဒေတာအတွဲတွင် NA၊ NaN သို့မဟုတ် Inf တန်ဖိုးများ ရှိပါသည်။ ဒေတာအတွဲရှိ ကိန်းရှင်များထဲမှ တစ်ခုသည် ဇာတ်ကောင်တစ်ခုဖြစ်သည်။ ဤအမှားကို ပြင်ဆင်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ ပျောက်ဆုံးနေသော ဒေတာပါရှိသော အတန်းများကို ဖယ်ရှားပြီး ဇာတ်ကောင် variable များကို factor...

Excel တွင် roc curve ဖန်တီးနည်း (အဆင့်ဆင့်)

Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model တစ်ခုနှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့အသုံးပြုသည့် ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန်၊ အောက်ပါ မက်ထရစ်နှစ်ခုကို ကြည့်နိုင်သည်- အာရုံခံစားနိုင်မှု- ရလဒ်အမှန်တကယ်အပြုသဘောဆောင်သောအခါတွင် လေ့လာမှုတစ်ခုအတွက် အပြုသဘောဆောင်သောရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့်ဖြစ်နိုင်ခြေ။ ၎င်းကို “စစ်မှန်သော အပြုသဘောနှုန်း” ဟုလည်း ခေါ်သည်။ တိကျမှု- ရလဒ်အမှန်တကယ် အနုတ်လက္ခဏာဖြစ်သောအခါ စောင့်ကြည့်မှုတစ်ခုအတွက် အနုတ်ရလဒ်ကို မော်ဒယ်က ခန့်မှန်းသည့် ဖြစ်နိုင်ခြေ။...

Roc curve (ဥပမာများနှင့်အတူ) အဓိပါယ်ဖွင့်နည်း

Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model တစ်ခုနှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့အသုံးပြုသည့် ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန်၊ အောက်ပါ မက်ထရစ်နှစ်ခုကို ကြည့်နိုင်သည်- အာရုံခံစားနိုင်မှု- ရလဒ်အမှန်တကယ်အပြုသဘောဆောင်သောအခါတွင် လေ့လာမှုတစ်ခုအတွက် အပြုသဘောဆောင်သောရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့်ဖြစ်နိုင်ခြေ။ တိကျမှု- ရလဒ်အမှန်တကယ် အနုတ်လက္ခဏာဖြစ်သောအခါ လေ့လာမှုတစ်ခုအတွက် အနုတ်ရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့် ဖြစ်နိုင်ခြေ။ ဤမက်ထရစ်နှစ်ခုကို မြင်သာစေရန် ရိုးရှင်းသောနည်းလမ်းမှာ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏...