Category: လမ်းညွှန်
Goldfeld-Quandt စမ်းသပ်မှု သည် ဆုတ်ယုတ်မှုပုံစံတွင် heteroskedasticity ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုသည်။ Heteroscedasticity သည် ဆုတ်ယုတ်မှု ပုံစံတစ်ခုရှိ တုံ့ပြန်မှု ပုံစံတစ်ခု၏ မတူညီသောအဆင့်များတွင် အကြွင်းအကျန်များ မညီမျှစွာ ပျံ့နှံ့သွားခြင်းကို ရည်ညွှန်းသည်။ heteroskedasticity ရှိနေပါက၊ ၎င်းသည် အကြွင်းအကျန်များကို တုံ့ပြန်မှုကိန်းရှင် အဆင့်တစ်ခုစီတွင် အညီအမျှ ခွဲဝေပေးသည့် မျဉ်းကြောင်းဆုတ်ယုတ်မှု၏ အဓိက ယူဆချက် တစ်ခုကို ချိုးဖောက်ပါသည်။ ဤသင်ခန်းစာသည် Python ရှိ Goldfeld-Quandt စမ်းသပ်မှုကို လုပ်ဆောင်ပုံအဆင့်ဆင့်ကို ဥပမာပေးထားသည်။ အဆင့် 1:...
ပန်ဒါ DataFrame တွင် တစ်နှစ်ပြီးတစ်နှစ် အတန်းများကို အုပ်စုဖွဲ့ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df. groupby (df. your_date_column . dt . year )[' values_column ']. sum () ဤအထူးဖော်မြူလာသည် your_date_column တွင် ရက်စွဲအလိုက် အတန်းများကို အုပ်စုဖွဲ့ပြီး DataFrame ရှိ values_column အတွက် တန်ဖိုးများ၏ ပေါင်းလဒ်များကို တွက်ချက်ပါသည်။ dt.year() လုပ်ဆောင်ချက်သည် ပန်ဒါများရှိ ရက်စွဲကော်လံတစ်ခုမှ တစ်နှစ်ကို...
ပန်ဒါ DataFrame အတန်းကို စာရင်းတစ်ခုအဖြစ်သို့ ပြောင်းလဲရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- row_list = df. loc [2 ,:]. values . flatten (). tolist () ဤအထူးအစီအမံသည် DataFrame ၏အတန်းအညွှန်းကိန်း၏ အနေအထား 2 ရှိ တန်ဖိုးများကို စာရင်းတစ်ခုအဖြစ်သို့ ပြောင်းပေးသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- Pandas DataFrame...
Python တွင် scikit-learn ဖြင့်တည်ဆောက်ထားသော regression model တစ်ခုမှ regression coefficients ကိုထုတ်ယူရန် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ p.d. DataFrame ( zip ( X.columns , model.coef_ )) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- Scikit-Learn မော်ဒယ်မှ ဆုတ်ယုတ်မှုကိန်းဂဏန်းများကို ထုတ်ယူပါ။ ကျွန်ုပ်တို့တွင် လေ့လာခဲ့သည့် နာရီများ၊ ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲအရေအတွက်နှင့် အတန်းတစ်ခန်းတွင်...
Pandas DataFrame ၏နောက်ဆုံးအတန်းကိုရယူရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- နောက်ဆုံးအတန်းကိုရယူပါ (ပန်ဒါစီးရီးများအတိုင်း) last_row = df. iloc [-1] နည်းလမ်း 2- နောက်ဆုံးအတန်းကိုရယူပါ (ပန်ဒါဒေတာဘောင်အဖြစ်) last_row = df. iloc [-1:] အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်- import pandas as pd #createDataFrame df = pd. DataFrame...
linear regression ၏ အဓိက ယူဆချက် တစ်ခုမှာ အကြွင်းအကျန်များကို ကြိုတင်ခန့်မှန်းကိန်းရှင် အဆင့်တစ်ခုစီတွင် တူညီသောကွဲလွဲမှုဖြင့် ဖြန့်ဝေပေးခြင်းဖြစ်သည်။ ဤယူဆချက်ကို homoscedasticity ဟုခေါ်သည်။ ဤယူဆချက်ကို မလေးစားပါက အကြွင်းအ ကျန်များတွင် ရှိနေသည်ဟု ဆိုပါသည်။ ထိုသို့ဖြစ်လာသောအခါ၊ ဆုတ်ယုတ်မှုရလဒ်များသည် ယုံကြည်စိတ်ချရခြင်းမရှိပေ။ ဤပြဿနာကိုဖြေရှင်းရန်နည်းလမ်းတစ်ခုမှာ အမှားကွဲလွဲမှုနည်းသော လေ့လာသုံးသပ်ချက်များ အတွက် အလေးများသတ်မှတ်ပေးသည့် အလေးချိန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှု ကိုအသုံးပြုခြင်းဖြစ်ပြီး အမှားကွဲလွဲမှုနည်းပါးသူများသည် အလေးချိန်ပိုမိုရရှိသောကြောင့် ၎င်းတို့တွင်အချက်အလက်များပိုမိုပါဝင်သောကြောင့် ၎င်းတို့တွင် အမှားအယွင်းကွဲလွဲမှုပိုများသောလေ့လာသုံးသပ်မှုများနှင့်နှိုင်းယှဉ်ပါ။ ဤသင်ခန်းစာသည် Python ရှိ အလေးချိန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှုလုပ်ဆောင်ပုံအဆင့်ဆင့်ကို ဥပမာပေးထားသည်။ အဆင့်...
R တွင် သင်ကြုံတွေ့နိုင်သော အမှားတစ်ခုမှာ- Error: Duplicate identifiers for rows ဒေတာဘောင်တစ်ခုအတွင်းရှိ ကော်လံတစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကော်လံများ၏ တန်ဖိုးများကို ၎င်းတို့၏ကိုယ်ပိုင်ကော်လံများသို့ ဖြန့်ကြက်ရန် spread() လုပ်ဆောင်ချက်ကို အသုံးပြုသည့်အခါ ဤအမှားသည် ဖြစ်ပေါ်လာပါသည်။ သို့ရာတွင်၊ အတန်းတစ်ခုစီအတွက် သီးသန့် ID မရှိလျှင် အမှားအယွင်းဖြစ်သွားနိုင်သည်၊ ထို့ကြောင့် ဖြန့်ဖြူးမှုကို လုပ်ဆောင်သည့်အခါ မည်သည့်တန်ဖိုးများကို ဆုံးဖြတ်ရန်နည်းလမ်းမရှိပါ။ အောက်ဖော်ပြပါ ဥပမာသည် ဤအမှားကို လက်တွေ့တွင် မည်သို့ပြုပြင်ရမည်ကို ပြသထားသည်။ ဥပမာ- အမှားကို...
ggplot2 တွင် ကွက်ကွက်တစ်ခုမှ NA တန်ဖိုးများကို ဖယ်ရှားရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- library (ggplot2) ggplot(data=subset(df, ! is. na (this_column)), aes(x=this_column)) + geom_bar() ဤဥပမာသည် barကွက်တစ်ခုဖန်တီးပြီး this_column ဟုခေါ်သောကော်လံတွင် NA တန်ဖိုးတစ်ခုပေါ်လာသည့်ဒေတာဘောင်မှအတန်းအားလုံးကိုဖယ်ရှားသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- ggplot2 ရှိ plot မှ NA များကို...
ဒေတာဘောင်များစွာကို အသုံးပြု၍ ggplot2 တွင် ကွက်ကွက်တစ်ခုဖန်တီးရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- library (ggplot2) ggplot() + geom_line(data=df1, aes(x=x_var, y=y_var), color=' blue ') + geom_line(data=df2, aes(x=x_var, y=y_var), color=' red ') ဤဥပမာသည် မတူညီသောဒေတာဘောင်နှစ်ခုမှဒေတာကိုအသုံးပြု၍ ggplot2 ရှိကွက်တစ်ခုတွင်မျဥ်းများစွာကိုဆွဲချသည်။ geom() အဆင့်တွင် ဒေတာဘောင်အမည်များကို သတ်မှတ်ခြင်းဖြင့်၊ ကျွန်ုပ်တို့သည် ကွက်ကွက်တစ်ခုတွင် ဒေတာဘောင်များစွာမှဒေတာကို ထည့်သွင်းနိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...
dplyr တွင် summarise() လုပ်ဆောင်ချက်ကို အသုံးပြုသောအခါ၊ summarise() သို့မဟုတ် group_by() လုပ်ဆောင်ချက်များတွင် မပါဝင်သည့် ကိန်းရှင်များကို အလိုအလျောက် ဖယ်ရှားပါမည်။ သို့ရာတွင်၊ သင်သည် ဒေတာဘောင်အတွင်း ကော်လံအားလုံးကို ထိန်းသိမ်းထားစဉ် ဒေတာကို အကျဉ်းချုပ်ရန် mutate() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- ဒေတာကို အကျဉ်းချုပ်သော်လည်း dplyr သုံးပြီး ကော်လံအားလုံးကို သိမ်းထားပါ။ ကျွန်ုပ်တို့တွင် အမျိုးမျိုးသော ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။ #create...