Category: လမ်းညွှန်
ပန်ဒါ DataFrame ရှိ တန်ဖိုးများ၏ စံသွေဖည်မှုကို တွက်ချက်ရန် DataFrame.std() လုပ်ဆောင်ချက်ကို သင် အသုံးပြုနိုင်သည်။ လက်တွေ့တွင် စံသွေဖည်မှုကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- ကော်လံတစ်ခု၏ စံသွေဖည်မှုကို တွက်ချက်ပါ။ df [ ' column_name ' ] . std ( ) နည်းလမ်း 2- ကော်လံများစွာ၏ စံသွေဖည်မှုကို တွက်ချက်ပါ။ df [[ ' column_name1 ', '...
လက်မ၏စည်းမျဉ်း ၊ တစ်ခါတစ်ရံ 68-95-99.7 စည်းမျဉ်းဟု ခေါ်သော၊ ပေးထားသောဒေတာအစုံအတွက် ပုံမှန်ဖြန့်ဝေမှုဖြင့် ဖော်ပြသည်- ဒေတာတန်ဖိုးများ၏ 68% သည် ဆိုလိုရင်း၏ စံသွေဖည်မှုတစ်ခုအတွင်းဖြစ်သည်။ ဒေတာတန်ဖိုးများ၏ 95% သည် ဆိုလိုရင်း၏ စံသွေဖည်မှုနှစ်ခုအတွင်း ရှိပါသည်။ ဒေတာတန်ဖိုးများ၏ 99.7% သည် စံသွေဖည်မှုသုံးမျိုးအတွင်း ကျရောက်သည်။ ဤကျူတိုရီရယ်တွင်၊ R တွင် လက်မ၏စည်းမျဉ်းကို ပေးထားသောဒေတာအတွဲသို့ မည်သို့အသုံးပြုရမည်ကို ရှင်းပြထားသည်။ R တွင် လက်မ၏ စည်းကမ်းကို ကျင့်သုံးခြင်း။ R ရှိ pnorm() လုပ်ဆောင်ချက်သည်...
စဉ်ဆက်မပြတ် ကိန်းသေကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် Pearson correlation coefficient ကို ကျွန်ုပ်တို့ အသုံးပြုလေ့ရှိသည်။ သို့သော်၊ အမည်များ သို့မဟုတ် အညွှန်းများကဲ့သို့သော အမျိုးအစားခွဲကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် မတူညီသော မက်ထရစ်ကို အသုံးပြုရန် လိုအပ်ပါသည်။ အိမ်ထောင်ရေးအခြေအနေ (လူပျို၊ အိမ်ထောင်၊ ကွာရှင်း) ဆေးလိပ်သောက်ခြင်းအခြေအနေ (ဆေးလိပ်သောက်သူ၊ ဆေးလိပ်မသောက်သူ) မျက်လုံးအရောင် (အပြာ၊ အညို၊ အစိမ်း) categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးများသော အတိုင်းအတာ သုံးခု ရှိပါသည်။...
One-hot encoding ကို machine learning algorithms မှ အလွယ်တကူ အသုံးပြုနိုင်သော အမျိုးအစားအဖြစ် ပြောင်းလဲနိုင်သော အမျိုးအစားအဖြစ် ပြောင်းလဲရန် အသုံးပြုပါသည်။ one-hot coding ၏ အခြေခံအယူအဆမှာ 0 နှင့် 1 တန်ဖိုးများကို မူရင်းအမျိုးအစားတန်ဖိုးများကိုကိုယ်စားပြုရန်အတွက် variable အသစ်များကိုဖန်တီးရန်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ အောက်ပါပုံသည် 0 နှင့် 1 တန်ဖိုးများသာရှိသော အမျိုးအစားအသစ်များပါရှိသော အဖွဲ့အမည်များပါရှိသော အမျိုးအစားကွဲပြားသော variable တစ်ခုကို ပြောင်းလဲရန်အတွက် ကျွန်ုပ်တို့သည် one-hot ကုဒ်နံပါတ်ကို မည်သို့ပြသထားသည်ကို...
Python ရှိ Seaborn data visualization library တွင် အပိုင်းခွဲများဖန်တီးရန် အောက်ပါအခြေခံ syntax ကို အသုံးပြုနိုင်ပါသည်။ #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ', y=' points ', ax=axes[0,0]) sns....
ပန်ဒါများတွင် ရက်စွဲတစ်ခုမှ လကို ထုတ်ယူရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df[' month '] = pd. DatetimeIndex (df[' date_column ']). month အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- Pandas တွင် ရက်စွဲမှ လကို ထုတ်ယူပါ။ ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။ import pandas as pd #createDataFrame df...
ကိန်းဂဏန်းစစ်ဆေးမှုများစွာသည် ဒေတာအစုံများကို ပုံမှန်ဖြန့်ဝေသည်ဟု ယူဆသည်။ သို့သော် လက်တွေ့တွင် ထိုသို့ဖြစ်လေ့မရှိပေ။ ဤပြဿနာကိုဖြေရှင်းရန် နည်းလမ်းတစ်ခုမှာ အသွင်ပြောင်းခြင်းသုံးခုအနက်မှ တစ်ခုကို အသုံးပြု၍ ဒေတာအတွဲတစ်ခုအတွင်း တန်ဖိုးများ ဖြန့်ဖြူးခြင်းကို ပြောင်းလဲခြင်းဖြစ်သည်- 1. မှတ်တမ်းအသွင်ပြောင်းခြင်း- တုံ့ပြန်မှုကိန်းရှင်ကို y မှ log(y) သို့ ပြောင်းလဲပါ။ 2. စတုရန်းအမြစ်အသွင်ပြောင်းခြင်း- တုံ့ပြန်မှုကိန်းရှင်ကို y မှ √y သို့ ပြောင်းလဲပါ။ 3. Cube root အသွင်ပြောင်းခြင်း- တုံ့ပြန်မှု variable ကို y မှ...
One-hot encoding ကို machine learning algorithms မှ အသုံးပြုနိုင်သော အမျိုးအစားသို့ အမျိုးအစားပြောင်းရန် အသုံးပြုသည်။ one-hot coding ၏ အခြေခံအယူအဆမှာ 0 နှင့် 1 တန်ဖိုးများကို မူရင်းအမျိုးအစားတန်ဖိုးများကိုကိုယ်စားပြုရန်အတွက် variable အသစ်များကိုဖန်တီးရန်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ အောက်ပါပုံသည် 0 နှင့် 1 တန်ဖိုးများသာရှိသော အမျိုးအစားအသစ်များပါရှိသော အဖွဲ့အမည်များပါရှိသော အမျိုးအစားကွဲပြားသော variable တစ်ခုကို ပြောင်းလဲရန်အတွက် ကျွန်ုပ်တို့သည် one-hot ကုဒ်နံပါတ်ကို မည်သို့ပြသထားသည်ကို ပြသသည်- အောက်ဖော်ပြပါ အဆင့်ဆင့်...
Polychoric correlation ကို ordinal variable များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ သာမာန်ကိန်းရှင်များသည် ဖြစ်နိုင်ချေတန်ဖိုးများ အမျိုးအစားအလိုက် ကွဲပြားပြီး သဘာဝကျသော ကိန်းရှင်များဖြစ်ကြောင်း သတိရပါ။ ဤသည်မှာ သာမာန်စကေးပေါ်တွင် တိုင်းတာထားသော ကိန်းရှင်အချို့၏ ဥပမာများဖြစ်သည်- ကျေနပ်မှု – အလွန်မကျေနပ်၊ မကျေနပ်၊ ကြားနေ၊ ကျေနပ်သည်၊ အလွန်ကျေနပ်သည်။ ဝင်ငွေအဆင့် – ဝင်ငွေနည်းသူ၊ အလယ်အလတ်ဝင်ငွေ၊ ဝင်ငွေမြင့်မားသည်။ အလုပ်တည်နေရာအခြေအနေ – ဝင်ရောက်လေ့လာသူ၊ ခွဲခြမ်းစိတ်ဖြာသူ I၊ ခွဲခြမ်းစိတ်ဖြာသူ II၊ အကြီးတန်းခွဲခြမ်းစိတ်ဖြာသူ...
Logistic regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ခန့်မှန်းပေးသူ variable များနှင့် တုံ့ပြန်မှု variable binary ဖြစ်သောအခါ တုံ့ပြန်မှု variable နှစ်ခုကြားဆက်စပ်မှုကို နားလည်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သော ဆုတ်ယုတ်မှုပုံစံတစ်မျိုးဖြစ်သည်။ အကယ်၍ ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းနိုင်သော ကိန်းရှင်တစ်ခုနှင့် တုံ့ပြန်မှုကိန်းရှင်တစ်ခုသာရှိလျှင်၊ ကိန်းရှင်များကြားရှိဆက်စပ်မှုကို ခန့်မှန်းရန် အောက်ပါဖော်မြူလာကိုအသုံးပြုသည့် ရိုးရှင်းသော ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်- log[p(X) / (1-p(X))] = β 0 + β 1 ညီမျှခြင်း၏ညာဘက်ရှိ ဖော်မြူလာသည်...