Category: လမ်းညွှန်

Pandas တွင် standard deviation ကို တွက်ချက်နည်း- ဥပမာများဖြင့်

ပန်ဒါ DataFrame ရှိ တန်ဖိုးများ၏ စံသွေဖည်မှုကို တွက်ချက်ရန် DataFrame.std() လုပ်ဆောင်ချက်ကို သင် အသုံးပြုနိုင်သည်။ လက်တွေ့တွင် စံသွေဖည်မှုကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- ကော်လံတစ်ခု၏ စံသွေဖည်မှုကို တွက်ချက်ပါ။ df [ ' column_name ' ] . std ( ) နည်းလမ်း 2- ကော်လံများစွာ၏ စံသွေဖည်မှုကို တွက်ချက်ပါ။ df [[ ' column_name1 ', '...

R တွင် လက်မ၏ စည်းကမ်းကို မည်ကဲ့သို့ကျင့်သုံးရမည်နည်း။

လက်မ၏စည်းမျဉ်း ၊ တစ်ခါတစ်ရံ 68-95-99.7 စည်းမျဉ်းဟု ခေါ်သော၊ ပေးထားသောဒေတာအစုံအတွက် ပုံမှန်ဖြန့်ဝေမှုဖြင့် ဖော်ပြသည်- ဒေတာတန်ဖိုးများ၏ 68% သည် ဆိုလိုရင်း၏ စံသွေဖည်မှုတစ်ခုအတွင်းဖြစ်သည်။ ဒေတာတန်ဖိုးများ၏ 95% သည် ဆိုလိုရင်း၏ စံသွေဖည်မှုနှစ်ခုအတွင်း ရှိပါသည်။ ဒေတာတန်ဖိုးများ၏ 99.7% သည် စံသွေဖည်မှုသုံးမျိုးအတွင်း ကျရောက်သည်။ ဤကျူတိုရီရယ်တွင်၊ R တွင် လက်မ၏စည်းမျဉ်းကို ပေးထားသောဒေတာအတွဲသို့ မည်သို့အသုံးပြုရမည်ကို ရှင်းပြထားသည်။ R တွင် လက်မ၏ စည်းကမ်းကို ကျင့်သုံးခြင်း။ R ရှိ pnorm() လုပ်ဆောင်ချက်သည်...

Categorical variable များကြား ဆက်စပ်မှုကို တွက်ချက်နည်း

စဉ်ဆက်မပြတ် ကိန်းသေကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် Pearson correlation coefficient ကို ကျွန်ုပ်တို့ အသုံးပြုလေ့ရှိသည်။ သို့သော်၊ အမည်များ သို့မဟုတ် အညွှန်းများကဲ့သို့သော အမျိုးအစားခွဲကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် မတူညီသော မက်ထရစ်ကို အသုံးပြုရန် လိုအပ်ပါသည်။ အိမ်ထောင်ရေးအခြေအနေ (လူပျို၊ အိမ်ထောင်၊ ကွာရှင်း) ဆေးလိပ်သောက်ခြင်းအခြေအနေ (ဆေးလိပ်သောက်သူ၊ ဆေးလိပ်မသောက်သူ) မျက်လုံးအရောင် (အပြာ၊ အညို၊ အစိမ်း) categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးများသော အတိုင်းအတာ သုံးခု ရှိပါသည်။...

Python တွင် one-hot encoding ပြုလုပ်နည်း

One-hot encoding ကို machine learning algorithms မှ အလွယ်တကူ အသုံးပြုနိုင်သော အမျိုးအစားအဖြစ် ပြောင်းလဲနိုင်သော အမျိုးအစားအဖြစ် ပြောင်းလဲရန် အသုံးပြုပါသည်။ one-hot coding ၏ အခြေခံအယူအဆမှာ 0 နှင့် 1 တန်ဖိုးများကို မူရင်းအမျိုးအစားတန်ဖိုးများကိုကိုယ်စားပြုရန်အတွက် variable အသစ်များကိုဖန်တီးရန်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ အောက်ပါပုံသည် 0 နှင့် 1 တန်ဖိုးများသာရှိသော အမျိုးအစားအသစ်များပါရှိသော အဖွဲ့အမည်များပါရှိသော အမျိုးအစားကွဲပြားသော variable တစ်ခုကို ပြောင်းလဲရန်အတွက် ကျွန်ုပ်တို့သည် one-hot ကုဒ်နံပါတ်ကို မည်သို့ပြသထားသည်ကို...

Seaborn တွင် အပိုင်းခွဲများ ဖန်တီးနည်း (ဥပမာများနှင့်အတူ)

Python ရှိ Seaborn data visualization library တွင် အပိုင်းခွဲများဖန်တီးရန် အောက်ပါအခြေခံ syntax ကို အသုံးပြုနိုင်ပါသည်။ #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ', y=' points ', ax=axes[0,0]) sns....

Pandas တွင် နေ့စွဲမှ လကို မည်သို့ထုတ်ယူနည်း (ဥပမာများဖြင့်)

ပန်ဒါများတွင် ရက်စွဲတစ်ခုမှ လကို ထုတ်ယူရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df[' month '] = pd. DatetimeIndex (df[' date_column ']). month အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- Pandas တွင် ရက်စွဲမှ လကို ထုတ်ယူပါ။ ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။ import pandas as pd #createDataFrame df...

Python (log၊ square root၊ cube root) တွင်ဒေတာကိုဘယ်လိုပြောင်းမလဲ

ကိန်းဂဏန်းစစ်ဆေးမှုများစွာသည် ဒေတာအစုံများကို ပုံမှန်ဖြန့်ဝေသည်ဟု ယူဆသည်။ သို့သော် လက်တွေ့တွင် ထိုသို့ဖြစ်လေ့မရှိပေ။ ဤပြဿနာကိုဖြေရှင်းရန် နည်းလမ်းတစ်ခုမှာ အသွင်ပြောင်းခြင်းသုံးခုအနက်မှ တစ်ခုကို အသုံးပြု၍ ဒေတာအတွဲတစ်ခုအတွင်း တန်ဖိုးများ ဖြန့်ဖြူးခြင်းကို ပြောင်းလဲခြင်းဖြစ်သည်- 1. မှတ်တမ်းအသွင်ပြောင်းခြင်း- တုံ့ပြန်မှုကိန်းရှင်ကို y မှ log(y) သို့ ပြောင်းလဲပါ။ 2. စတုရန်းအမြစ်အသွင်ပြောင်းခြင်း- တုံ့ပြန်မှုကိန်းရှင်ကို y မှ √y သို့ ပြောင်းလဲပါ။ 3. Cube root အသွင်ပြောင်းခြင်း- တုံ့ပြန်မှု variable ကို y မှ...

R တွင် one-hot encoding လုပ်နည်း

One-hot encoding ကို machine learning algorithms မှ အသုံးပြုနိုင်သော အမျိုးအစားသို့ အမျိုးအစားပြောင်းရန် အသုံးပြုသည်။ one-hot coding ၏ အခြေခံအယူအဆမှာ 0 နှင့် 1 တန်ဖိုးများကို မူရင်းအမျိုးအစားတန်ဖိုးများကိုကိုယ်စားပြုရန်အတွက် variable အသစ်များကိုဖန်တီးရန်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ အောက်ပါပုံသည် 0 နှင့် 1 တန်ဖိုးများသာရှိသော အမျိုးအစားအသစ်များပါရှိသော အဖွဲ့အမည်များပါရှိသော အမျိုးအစားကွဲပြားသော variable တစ်ခုကို ပြောင်းလဲရန်အတွက် ကျွန်ုပ်တို့သည် one-hot ကုဒ်နံပါတ်ကို မည်သို့ပြသထားသည်ကို ပြသသည်- အောက်ဖော်ပြပါ အဆင့်ဆင့်...

R တွင် polychoric ဆက်စပ်မှုကို တွက်နည်း

Polychoric correlation ကို ordinal variable များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ သာမာန်ကိန်းရှင်များသည် ဖြစ်နိုင်ချေတန်ဖိုးများ အမျိုးအစားအလိုက် ကွဲပြားပြီး သဘာဝကျသော ကိန်းရှင်များဖြစ်ကြောင်း သတိရပါ။ ဤသည်မှာ သာမာန်စကေးပေါ်တွင် တိုင်းတာထားသော ကိန်းရှင်အချို့၏ ဥပမာများဖြစ်သည်- ကျေနပ်မှု – အလွန်မကျေနပ်၊ မကျေနပ်၊ ကြားနေ၊ ကျေနပ်သည်၊ အလွန်ကျေနပ်သည်။ ဝင်ငွေအဆင့် – ဝင်ငွေနည်းသူ၊ အလယ်အလတ်ဝင်ငွေ၊ ဝင်ငွေမြင့်မားသည်။ အလုပ်တည်နေရာအခြေအနေ – ဝင်ရောက်လေ့လာသူ၊ ခွဲခြမ်းစိတ်ဖြာသူ I၊ ခွဲခြမ်းစိတ်ဖြာသူ II၊ အကြီးတန်းခွဲခြမ်းစိတ်ဖြာသူ...

Logistic regression အတွက် null hypothesis ကို နားလည်ခြင်း။

Logistic regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ခန့်မှန်းပေးသူ variable များနှင့် တုံ့ပြန်မှု variable binary ဖြစ်သောအခါ တုံ့ပြန်မှု variable နှစ်ခုကြားဆက်စပ်မှုကို နားလည်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သော ဆုတ်ယုတ်မှုပုံစံတစ်မျိုးဖြစ်သည်။ အကယ်၍ ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းနိုင်သော ကိန်းရှင်တစ်ခုနှင့် တုံ့ပြန်မှုကိန်းရှင်တစ်ခုသာရှိလျှင်၊ ကိန်းရှင်များကြားရှိဆက်စပ်မှုကို ခန့်မှန်းရန် အောက်ပါဖော်မြူလာကိုအသုံးပြုသည့် ရိုးရှင်းသော ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်- log[p(X) / (1-p(X))] = β 0 + β 1 ညီမျှခြင်း၏ညာဘက်ရှိ ဖော်မြူလာသည်...