Category: လမ်းညွှန်
ပန်ဒါ DataFrame တွင် ကော်လံနှစ်ခု၏ အနေအထားကို လဲလှယ်ရန် အောက်ပါစိတ်ကြိုက်လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်- def swap_columns (df, col1, col2): col_list = list ( df.columns ) x, y = col_list. index (col1), col_list. index (col2) col_list[y], col_list[x] = col_list[x], col_list[y] df = df[col_list] return df ဤလုပ်ဆောင်ချက်သည် DataFrame ရှိ...
R-squared ၊ မကြာခဏရေးထားသော R2 သည် linear regression model တွင် ခန့်မှန်းသူကိန်းရှင်များမှ ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။ R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ 1 အထိ ကွဲပြားနိုင်သည်- 0 သည် တုံ့ပြန်မှုကိန်းရှင်ကို ခန့်မှန်းသူကိန်းရှင်က လုံးဝရှင်းပြ၍မရကြောင်း ညွှန်ပြသည်။ 1 သည် တုံ့ပြန်မှုကိန်းရှင်အား ကြိုတင်ခန့်မှန်းကိန်းရှင်များမှ အမှားအယွင်းမရှိဘဲ စုံလင်စွာရှင်းပြနိုင်သည်ကို ညွှန်ပြသည်။ အောက်ပါဥပမာသည် Python ရှိ regression model အတွက် R...
Python ကိုအသုံးပြုရာတွင် သင်ကြုံတွေ့ရနိုင်သည့် အမှားတစ်ခုမှာ- TypeError : unsupported operand type(s) for -: 'str' and 'int' string variable နှင့် numeric variable ဖြင့် နုတ်ရန် ကြိုးပမ်းသောအခါ ဤအမှားသည် ဖြစ်ပေါ်လာပါသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤအမှားကို လက်တွေ့ဖြေရှင်းနည်းကို ပြသထားသည်။ အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။ ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။ import pandas as pd...
ကျွန်ုပ်တို့သည် linear regression မော်ဒယ်များနှင့် ကိုက်ညီသောအခါ၊ မော်ဒယ်၏ R-squared တန်ဖိုးကို မကြာခဏ တွက်ချက်ပါသည်။ R-squared တန်ဖိုးသည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းရှင်များမှ ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။ R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ 1 အထိ ကွဲပြားနိုင်သည်- 0 ၏တန်ဖိုးသည် တုံ့ပြန်မှုကိန်းရှင်အား ခန့်မှန်းသူကိန်းရှင်များမှ လုံးဝရှင်းပြမရနိုင်ကြောင်း ညွှန်ပြသည်။ 1 ၏တန်ဖိုးသည် တုံ့ပြန်မှုကိန်းရှင်အား ကြိုတင်ခန့်မှန်းကိန်းရှင်များမှ စုံလင်စွာရှင်းပြနိုင်သည်ကို ညွှန်ပြသည်။ ဤမက်ထရစ်အား ဆုတ်ယုတ်မှုပုံစံတစ်ခုသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း...
histogram သည် data set တစ်ခုတွင် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် အသုံးဝင်သော နည်းလမ်းကို ပံ့ပိုးပေးပါသည်။ ဟစ်စတိုဂရမ်တစ်ခု၏ x-axis သည် ဒေတာတန်ဖိုးအုပ်စုများကို ပြသပြီး y-axis သည် အုပ်စုတစ်ခုစီတွင် ဒေတာအစုတစ်ခုစီတွင် မှတ်သားမှုမည်မျှရှိသည်ကို ပြောပြသည်။ ဟီစတိုဂရမ်တစ်ခုသည် စူးစမ်းလေ့လာမှုများကို bins များအတွင်း ထည့်ထားသောကြောင့်၊ ဟီစတိုဂရမ်ဖြင့် ကိုယ်စားပြုထားသော ဒေတာအစုံ၏ စံသွေဖည်မှုကို အတိအကျ တွက်ချက်ရန် မဖြစ်နိုင်သော်လည်း စံသွေဖည်မှုကို ခန့်မှန်းရန် ဖြစ်နိုင်သည်။ အောက်ပါဥပမာသည် ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။...
စက်သင်ယူမှုတွင်၊ အမျိုးအစားခွဲခွဲခြားမှုနှုန်း သည် အမျိုးအစားခွဲခြားမှုပုံစံ ဖြင့် မှားယွင်းစွာခန့်မှန်းထားသော လေ့လာတွေ့ရှိမှုရာခိုင်နှုန်းကို ပြောပြသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ Misclassification rate = # မမှန်ကန်သော ခန့်မှန်းချက်များ / စုစုပေါင်း ခန့်မှန်းချက် # ခု မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်း၏ တန်ဖိုးသည် 0 မှ 1 အထိ ကွဲပြားနိုင်သည်- ဘ၀ကို ကိုယ်စားပြုသော မော်ဒယ်သည် မှားယွင်းသော ခန့်မှန်းချက်များ မရှိပါ။ 1 သည် ခန့်မှန်းချက် လုံးဝမှားယွင်းနေသော မော်ဒယ်ကို...
လူဦးရေကန့်သတ်ချက် နှင့်ပတ်သက်သော ယူဆချက်သည် မှန်ကန်ခြင်းရှိ၊ မရှိ စမ်းသပ်ရန် စမ်းသပ်မှု တစ်ခုအား အသုံးပြုသည်။ ကျွန်ုပ်တို့သည် သီအိုရီစမ်းသပ်မှုတစ်ခုကို ပြုလုပ်သည့်အခါတိုင်း၊ ကျွန်ုပ်တို့သည် null နှင့် အခြား hypothesis ကို အမြဲတမ်း သတ်မှတ်ဖော်ပြသည်- Null hypothesis (H 0 ) : နမူနာဒေတာသည် အခွင့်အလမ်းတစ်ခုတည်းမှလာသည်။ အစားထိုး အယူအဆ ( HA ) : နမူနာဒေတာသည် ကျပန်းမဟုတ်သော အကြောင်းတရားကြောင့် လွှမ်းမိုးထားသည်။ အကယ်၍ သီအိုရီစမ်းသပ်မှု၏ p-တန်ဖိုး...
အမျိုးအစားခွဲခြင်းပုံစံ တစ်ခု၏စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန် အသုံးအများဆုံးနည်းလမ်းတစ်ခုမှာ dataset ၏အမှန်တကယ်ရလဒ်များနှင့်ယှဉ်ပြီး model ၏ခန့်မှန်းရလဒ်များကို အကျဉ်းချုပ်ဖော်ပြသည့် ရှုပ်ထွေးသော matrix ကိုဖန်တီးရန်ဖြစ်သည်။ ရှုပ်ထွေးမှုမက်ထရစ်ကို ကျွန်ုပ်တို့စိတ်ဝင်စားလေ့ရှိသော မက်ထရစ်နှစ်ခုသည် အပြုသဘောဆောင်သော ခန့်မှန်းတန်ဖိုး နှင့် အာရုံခံနိုင်စွမ်း ဖြစ်သည်။ အပြုသဘောဆောင်သော ခန့်မှန်းချက်တန်ဖိုး သည် အပြုသဘောဆောင်သော ကြိုတင်ခန့်မှန်းမှုရလဒ်တစ်ခုနှင့် စူးစမ်းလေ့လာမှုတစ်ခုသည် အမှန်တကယ်အပြုသဘောဆောင်သောရလဒ်ကို ရရှိသည် ဟူသော ဖြစ်နိုင်ခြေရှိသည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ အပြုသဘောဆောင်သော ခန့်မှန်းတန်ဖိုး = True Positives / (True Positives +...
R တွင် သင်ကြုံတွေ့ရသော အမှားတစ်ခုမှာ- Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)): invalid graphics state ဤအမှားသည် အကြောင်းရင်းသုံးခုကြောင့် ဖြစ်ပွားနိုင်သည်- 1. တူညီသော session တစ်ခုအတွင်း base R နှင့် ggplot2 တွင် သင်ကွက်ကွက်များကို ဖန်တီးပါ။ 2. သင့် ggplot2 ဗားရှင်းသည် သင့် R ဗားရှင်းနှင့် ကိုက်ညီမှုမရှိပါ။ 3. သင်၏ဂရပ်ဖစ်ဆက်တင်များသည် ကွက်သစ်များဖန်တီးခြင်းမှ တားဆီးသည်။ ဤအမှားအယွင်းကို ဖြေရှင်းရန် ဤသင်ခန်းစာတွင်...
R ရှိ readLines() လုပ်ဆောင်ချက်ကို ချိတ်ဆက်မှုအရာဝတ္ထုမှ စာသားမျဉ်းအားလုံး သို့မဟုတ် တစ်စိတ်တစ်ပိုင်းကို ဖတ်ရန် အသုံးပြုနိုင်သည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်- readLines(con, n=-1L) ရွှေ- အားနည်းချက်- ချိတ်ဆက်မှု အရာဝတ္ထု သို့မဟုတ် စာလုံး string တစ်ခု n- ဖတ်ရန် အများဆုံး စာကြောင်းများ။ မူရင်းမှာ စာကြောင်းအားလုံးကို ဖတ်ရန်ဖြစ်သည်။ အောက်ဖော်ပြပါနမူနာများသည် some_data.txt ဟုခေါ်သော အောက်ပါစာသားဖိုင်ဖြင့် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးပြုနည်းကို ပြသသည် ဥပမာ 1- စာသားဖိုင်တစ်ခုမှ...