Category: လမ်းညွှန်

Python ရှိ goldfeld-quandt စမ်းသပ်နည်း

Goldfeld-Quandt စမ်းသပ်မှု သည် ဆုတ်ယုတ်မှုပုံစံတွင် heteroskedasticity ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုသည်။ Heteroscedasticity သည် ဆုတ်ယုတ်မှု ပုံစံတစ်ခုရှိ တုံ့ပြန်မှု ပုံစံတစ်ခု၏ မတူညီသောအဆင့်များတွင် အကြွင်းအကျန်များ မညီမျှစွာ ပျံ့နှံ့သွားခြင်းကို ရည်ညွှန်းသည်။ heteroskedasticity ရှိနေပါက၊ ၎င်းသည် အကြွင်းအကျန်များကို တုံ့ပြန်မှုကိန်းရှင် အဆင့်တစ်ခုစီတွင် အညီအမျှ ခွဲဝေပေးသည့် မျဉ်းကြောင်းဆုတ်ယုတ်မှု၏ အဓိက ယူဆချက် တစ်ခုကို ချိုးဖောက်ပါသည်။ ဤသင်ခန်းစာသည် Python ရှိ Goldfeld-Quandt စမ်းသပ်မှုကို လုပ်ဆောင်ပုံအဆင့်ဆင့်ကို ဥပမာပေးထားသည်။ အဆင့် 1:...

Pandas dataframe တွင် တစ်နှစ်အလိုက် အုပ်စုဖွဲ့နည်း (ဥပမာနှင့်အတူ)

ပန်ဒါ DataFrame တွင် တစ်နှစ်ပြီးတစ်နှစ် အတန်းများကို အုပ်စုဖွဲ့ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df. groupby (df. your_date_column . dt . year )[' values_column ']. sum () ဤအထူးဖော်မြူလာသည် your_date_column တွင် ရက်စွဲအလိုက် အတန်းများကို အုပ်စုဖွဲ့ပြီး DataFrame ရှိ values_column အတွက် တန်ဖိုးများ၏ ပေါင်းလဒ်များကို တွက်ချက်ပါသည်။ dt.year() လုပ်ဆောင်ချက်သည် ပန်ဒါများရှိ ရက်စွဲကော်လံတစ်ခုမှ တစ်နှစ်ကို...

Pandas dataframe အတန်းကို စာရင်းတစ်ခုသို့ မည်သို့ပြောင်းနည်း (ဥပမာဖြင့်)

ပန်ဒါ DataFrame အတန်းကို စာရင်းတစ်ခုအဖြစ်သို့ ပြောင်းလဲရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- row_list = df. loc [2 ,:]. values . flatten (). tolist () ဤအထူးအစီအမံသည် DataFrame ၏အတန်းအညွှန်းကိန်း၏ အနေအထား 2 ရှိ တန်ဖိုးများကို စာရင်းတစ်ခုအဖြစ်သို့ ပြောင်းပေးသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- Pandas DataFrame...

Scikit-learn မော်ဒယ်မှ ဆုတ်ယုတ်မှုကိန်းဂဏန်းများကို မည်သို့ထုတ်ယူနည်း

Python တွင် scikit-learn ဖြင့်တည်ဆောက်ထားသော regression model တစ်ခုမှ regression coefficients ကိုထုတ်ယူရန် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ p.d. DataFrame ( zip ( X.columns , model.coef_ )) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- Scikit-Learn မော်ဒယ်မှ ဆုတ်ယုတ်မှုကိန်းဂဏန်းများကို ထုတ်ယူပါ။ ကျွန်ုပ်တို့တွင် လေ့လာခဲ့သည့် နာရီများ၊ ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲအရေအတွက်နှင့် အတန်းတစ်ခန်းတွင်...

Pandas dataframe (ဥပမာနှင့်အတူ) နောက်ဆုံးအတန်းကိုဘယ်လိုရနိုင်မလဲ။

Pandas DataFrame ၏နောက်ဆုံးအတန်းကိုရယူရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- နောက်ဆုံးအတန်းကိုရယူပါ (ပန်ဒါစီးရီးများအတိုင်း) last_row = df. iloc [-1] နည်းလမ်း 2- နောက်ဆုံးအတန်းကိုရယူပါ (ပန်ဒါဒေတာဘောင်အဖြစ်) last_row = df. iloc [-1:] အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်- import pandas as pd #createDataFrame df = pd. DataFrame...

Python တွင် အလေးချိန်အနည်းဆုံးစတုရန်းများ ဆုတ်ယုတ်မှုအား မည်သို့လုပ်ဆောင်ရမည်နည်း။

linear regression ၏ အဓိက ယူဆချက် တစ်ခုမှာ အကြွင်းအကျန်များကို ကြိုတင်ခန့်မှန်းကိန်းရှင် အဆင့်တစ်ခုစီတွင် တူညီသောကွဲလွဲမှုဖြင့် ဖြန့်ဝေပေးခြင်းဖြစ်သည်။ ဤယူဆချက်ကို homoscedasticity ဟုခေါ်သည်။ ဤယူဆချက်ကို မလေးစားပါက အကြွင်းအ ကျန်များတွင် ရှိနေသည်ဟု ဆိုပါသည်။ ထိုသို့ဖြစ်လာသောအခါ၊ ဆုတ်ယုတ်မှုရလဒ်များသည် ယုံကြည်စိတ်ချရခြင်းမရှိပေ။ ဤပြဿနာကိုဖြေရှင်းရန်နည်းလမ်းတစ်ခုမှာ အမှားကွဲလွဲမှုနည်းသော လေ့လာသုံးသပ်ချက်များ အတွက် အလေးများသတ်မှတ်ပေးသည့် အလေးချိန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှု ကိုအသုံးပြုခြင်းဖြစ်ပြီး အမှားကွဲလွဲမှုနည်းပါးသူများသည် အလေးချိန်ပိုမိုရရှိသောကြောင့် ၎င်းတို့တွင်အချက်အလက်များပိုမိုပါဝင်သောကြောင့် ၎င်းတို့တွင် အမှားအယွင်းကွဲလွဲမှုပိုများသောလေ့လာသုံးသပ်မှုများနှင့်နှိုင်းယှဉ်ပါ။ ဤသင်ခန်းစာသည် Python ရှိ အလေးချိန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှုလုပ်ဆောင်ပုံအဆင့်ဆင့်ကို ဥပမာပေးထားသည်။ အဆင့်...

R- error တွင် ပြင်ဆင်နည်း- အတန်းများအတွက် ခွဲခြားသတ်မှတ်မှုများ ထပ်နေပါသည်။

R တွင် သင်ကြုံတွေ့နိုင်သော အမှားတစ်ခုမှာ- Error: Duplicate identifiers for rows ဒေတာဘောင်တစ်ခုအတွင်းရှိ ကော်လံတစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကော်လံများ၏ တန်ဖိုးများကို ၎င်းတို့၏ကိုယ်ပိုင်ကော်လံများသို့ ဖြန့်ကြက်ရန် spread() လုပ်ဆောင်ချက်ကို အသုံးပြုသည့်အခါ ဤအမှားသည် ဖြစ်ပေါ်လာပါသည်။ သို့ရာတွင်၊ အတန်းတစ်ခုစီအတွက် သီးသန့် ID မရှိလျှင် အမှားအယွင်းဖြစ်သွားနိုင်သည်၊ ထို့ကြောင့် ဖြန့်ဖြူးမှုကို လုပ်ဆောင်သည့်အခါ မည်သည့်တန်ဖိုးများကို ဆုံးဖြတ်ရန်နည်းလမ်းမရှိပါ။ အောက်ဖော်ပြပါ ဥပမာသည် ဤအမှားကို လက်တွေ့တွင် မည်သို့ပြုပြင်ရမည်ကို ပြသထားသည်။ ဥပမာ- အမှားကို...

Ggplot2 တွင် plot မှ nas ကိုမည်သို့ဖယ်ရှားနည်း (ဥပမာနှင့်အတူ)

ggplot2 တွင် ကွက်ကွက်တစ်ခုမှ NA တန်ဖိုးများကို ဖယ်ရှားရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- library (ggplot2) ggplot(data=subset(df, ! is. na (this_column)), aes(x=this_column)) + geom_bar() ဤဥပမာသည် barကွက်တစ်ခုဖန်တီးပြီး this_column ဟုခေါ်သောကော်လံတွင် NA တန်ဖိုးတစ်ခုပေါ်လာသည့်ဒေတာဘောင်မှအတန်းအားလုံးကိုဖယ်ရှားသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- ggplot2 ရှိ plot မှ NA များကို...

ဒေတာဘောင်များစွာကို အသုံးပြု၍ ggplot2 တွင်ကွက်ကွက်တစ်ခုဖန်တီးနည်း

ဒေတာဘောင်များစွာကို အသုံးပြု၍ ggplot2 တွင် ကွက်ကွက်တစ်ခုဖန်တီးရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- library (ggplot2) ggplot() + geom_line(data=df1, aes(x=x_var, y=y_var), color=' blue ') + geom_line(data=df2, aes(x=x_var, y=y_var), color=' red ') ဤဥပမာသည် မတူညီသောဒေတာဘောင်နှစ်ခုမှဒေတာကိုအသုံးပြု၍ ggplot2 ရှိကွက်တစ်ခုတွင်မျဥ်းများစွာကိုဆွဲချသည်။ geom() အဆင့်တွင် ဒေတာဘောင်အမည်များကို သတ်မှတ်ခြင်းဖြင့်၊ ကျွန်ုပ်တို့သည် ကွက်ကွက်တစ်ခုတွင် ဒေတာဘောင်များစွာမှဒေတာကို ထည့်သွင်းနိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...

Dplyr- ဒေတာအကျဉ်းချုပ်နည်း၊ ကော်လံအားလုံးကို သိမ်းထားပါ။

dplyr တွင် summarise() လုပ်ဆောင်ချက်ကို အသုံးပြုသောအခါ၊ summarise() သို့မဟုတ် group_by() လုပ်ဆောင်ချက်များတွင် မပါဝင်သည့် ကိန်းရှင်များကို အလိုအလျောက် ဖယ်ရှားပါမည်။ သို့ရာတွင်၊ သင်သည် ဒေတာဘောင်အတွင်း ကော်လံအားလုံးကို ထိန်းသိမ်းထားစဉ် ဒေတာကို အကျဉ်းချုပ်ရန် mutate() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- ဒေတာကို အကျဉ်းချုပ်သော်လည်း dplyr သုံးပြီး ကော်လံအားလုံးကို သိမ်းထားပါ။ ကျွန်ုပ်တို့တွင် အမျိုးမျိုးသော ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။ #create...