Category: လမ်းညွှန်

Python ရှိ goldfeld-quandt စမ်းသပ်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Goldfeld-Quandt စမ်းသပ်မှု သည် ဆုတ်ယုတ်မှုပုံစံတွင် heteroskedasticity ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုသည်။ Heteroscedasticity သည် ဆုတ်ယုတ်မှု ပုံစံတစ်ခုရှိ တုံ့ပြန်မှု ပုံစံတစ်ခု၏ မတူညီသောအဆင့်များတွင် အကြွင်းအကျန်များ မညီမျှစွာ ပျံ့နှံ့သွားခြင်းကို ရည်ညွှန်းသည်။ heteroskedasticity ရှိနေပါက၊ ၎င်းသည် အကြွင်းအကျန်များကို တုံ့ပြန်မှုကိန်းရှင် အဆင့်တစ်ခုစီတွင် အညီအမျှ ခွဲဝေပေးသည့် မျဉ်းကြောင်းဆုတ်ယုတ်မှု၏ အဓိက ယူဆချက် တစ်ခုကို ချိုးဖောက်ပါသည်။ ဤသင်ခန်းစာသည် Python ရှိ Goldfeld-Quandt စမ်းသပ်မှုကို လုပ်ဆောင်ပုံအဆင့်ဆင့်ကို ဥပမာပေးထားသည်။ အဆင့် 1:...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas dataframe တွင် တစ်နှစ်အလိုက် အုပ်စုဖွဲ့နည်း (ဥပမာနှင့်အတူ)

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ပန်ဒါ DataFrame တွင် တစ်နှစ်ပြီးတစ်နှစ် အတန်းများကို အုပ်စုဖွဲ့ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df. groupby (df. your_date_column . dt . year )[' values_column ']. sum () ဤအထူးဖော်မြူလာသည် your_date_column တွင် ရက်စွဲအလိုက် အတန်းများကို အုပ်စုဖွဲ့ပြီး DataFrame ရှိ values_column အတွက် တန်ဖိုးများ၏ ပေါင်းလဒ်များကို တွက်ချက်ပါသည်။ dt.year() လုပ်ဆောင်ချက်သည် ပန်ဒါများရှိ ရက်စွဲကော်လံတစ်ခုမှ တစ်နှစ်ကို...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas dataframe အတန်းကို စာရင်းတစ်ခုသို့ မည်သို့ပြောင်းနည်း (ဥပမာဖြင့်)

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ပန်ဒါ DataFrame အတန်းကို စာရင်းတစ်ခုအဖြစ်သို့ ပြောင်းလဲရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- row_list = df. loc [2 ,:]. values . flatten (). tolist () ဤအထူးအစီအမံသည် DataFrame ၏အတန်းအညွှန်းကိန်း၏ အနေအထား 2 ရှိ တန်ဖိုးများကို စာရင်းတစ်ခုအဖြစ်သို့ ပြောင်းပေးသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- Pandas DataFrame...

[ဆက်လက်ဖတ်ရှုရန်...]

Scikit-learn မော်ဒယ်မှ ဆုတ်ယုတ်မှုကိန်းဂဏန်းများကို မည်သို့ထုတ်ယူနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Python တွင် scikit-learn ဖြင့်တည်ဆောက်ထားသော regression model တစ်ခုမှ regression coefficients ကိုထုတ်ယူရန် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ p.d. DataFrame ( zip ( X.columns , model.coef_ )) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- Scikit-Learn မော်ဒယ်မှ ဆုတ်ယုတ်မှုကိန်းဂဏန်းများကို ထုတ်ယူပါ။ ကျွန်ုပ်တို့တွင် လေ့လာခဲ့သည့် နာရီများ၊ ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲအရေအတွက်နှင့် အတန်းတစ်ခန်းတွင်...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas dataframe (ဥပမာနှင့်အတူ) နောက်ဆုံးအတန်းကိုဘယ်လိုရနိုင်မလဲ။

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Pandas DataFrame ၏နောက်ဆုံးအတန်းကိုရယူရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- နောက်ဆုံးအတန်းကိုရယူပါ (ပန်ဒါစီးရီးများအတိုင်း) last_row = df. iloc [-1] နည်းလမ်း 2- နောက်ဆုံးအတန်းကိုရယူပါ (ပန်ဒါဒေတာဘောင်အဖြစ်) last_row = df. iloc [-1:] အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်- import pandas as pd #createDataFrame df = pd. DataFrame...

[ဆက်လက်ဖတ်ရှုရန်...]

Python တွင် အလေးချိန်အနည်းဆုံးစတုရန်းများ ဆုတ်ယုတ်မှုအား မည်သို့လုပ်ဆောင်ရမည်နည်း။

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

linear regression ၏ အဓိက ယူဆချက် တစ်ခုမှာ အကြွင်းအကျန်များကို ကြိုတင်ခန့်မှန်းကိန်းရှင် အဆင့်တစ်ခုစီတွင် တူညီသောကွဲလွဲမှုဖြင့် ဖြန့်ဝေပေးခြင်းဖြစ်သည်။ ဤယူဆချက်ကို homoscedasticity ဟုခေါ်သည်။ ဤယူဆချက်ကို မလေးစားပါက အကြွင်းအ ကျန်များတွင် ရှိနေသည်ဟု ဆိုပါသည်။ ထိုသို့ဖြစ်လာသောအခါ၊ ဆုတ်ယုတ်မှုရလဒ်များသည် ယုံကြည်စိတ်ချရခြင်းမရှိပေ။ ဤပြဿနာကိုဖြေရှင်းရန်နည်းလမ်းတစ်ခုမှာ အမှားကွဲလွဲမှုနည်းသော လေ့လာသုံးသပ်ချက်များ အတွက် အလေးများသတ်မှတ်ပေးသည့် အလေးချိန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှု ကိုအသုံးပြုခြင်းဖြစ်ပြီး အမှားကွဲလွဲမှုနည်းပါးသူများသည် အလေးချိန်ပိုမိုရရှိသောကြောင့် ၎င်းတို့တွင်အချက်အလက်များပိုမိုပါဝင်သောကြောင့် ၎င်းတို့တွင် အမှားအယွင်းကွဲလွဲမှုပိုများသောလေ့လာသုံးသပ်မှုများနှင့်နှိုင်းယှဉ်ပါ။ ဤသင်ခန်းစာသည် Python ရှိ အလေးချိန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှုလုပ်ဆောင်ပုံအဆင့်ဆင့်ကို ဥပမာပေးထားသည်။ အဆင့်...

[ဆက်လက်ဖတ်ရှုရန်...]

R- error တွင် ပြင်ဆင်နည်း- အတန်းများအတွက် ခွဲခြားသတ်မှတ်မှုများ ထပ်နေပါသည်။

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

R တွင် သင်ကြုံတွေ့နိုင်သော အမှားတစ်ခုမှာ- Error: Duplicate identifiers for rows ဒေတာဘောင်တစ်ခုအတွင်းရှိ ကော်လံတစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကော်လံများ၏ တန်ဖိုးများကို ၎င်းတို့၏ကိုယ်ပိုင်ကော်လံများသို့ ဖြန့်ကြက်ရန် spread() လုပ်ဆောင်ချက်ကို အသုံးပြုသည့်အခါ ဤအမှားသည် ဖြစ်ပေါ်လာပါသည်။ သို့ရာတွင်၊ အတန်းတစ်ခုစီအတွက် သီးသန့် ID မရှိလျှင် အမှားအယွင်းဖြစ်သွားနိုင်သည်၊ ထို့ကြောင့် ဖြန့်ဖြူးမှုကို လုပ်ဆောင်သည့်အခါ မည်သည့်တန်ဖိုးများကို ဆုံးဖြတ်ရန်နည်းလမ်းမရှိပါ။ အောက်ဖော်ပြပါ ဥပမာသည် ဤအမှားကို လက်တွေ့တွင် မည်သို့ပြုပြင်ရမည်ကို ပြသထားသည်။ ဥပမာ- အမှားကို...

[ဆက်လက်ဖတ်ရှုရန်...]

Ggplot2 တွင် plot မှ nas ကိုမည်သို့ဖယ်ရှားနည်း (ဥပမာနှင့်အတူ)

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ggplot2 တွင် ကွက်ကွက်တစ်ခုမှ NA တန်ဖိုးများကို ဖယ်ရှားရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- library (ggplot2) ggplot(data=subset(df, ! is. na (this_column)), aes(x=this_column)) + geom_bar() ဤဥပမာသည် barကွက်တစ်ခုဖန်တီးပြီး this_column ဟုခေါ်သောကော်လံတွင် NA တန်ဖိုးတစ်ခုပေါ်လာသည့်ဒေတာဘောင်မှအတန်းအားလုံးကိုဖယ်ရှားသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- ggplot2 ရှိ plot မှ NA များကို...

[ဆက်လက်ဖတ်ရှုရန်...]

ဒေတာဘောင်များစွာကို အသုံးပြု၍ ggplot2 တွင်ကွက်ကွက်တစ်ခုဖန်တီးနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ဒေတာဘောင်များစွာကို အသုံးပြု၍ ggplot2 တွင် ကွက်ကွက်တစ်ခုဖန်တီးရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- library (ggplot2) ggplot() + geom_line(data=df1, aes(x=x_var, y=y_var), color=' blue ') + geom_line(data=df2, aes(x=x_var, y=y_var), color=' red ') ဤဥပမာသည် မတူညီသောဒေတာဘောင်နှစ်ခုမှဒေတာကိုအသုံးပြု၍ ggplot2 ရှိကွက်တစ်ခုတွင်မျဥ်းများစွာကိုဆွဲချသည်။ geom() အဆင့်တွင် ဒေတာဘောင်အမည်များကို သတ်မှတ်ခြင်းဖြင့်၊ ကျွန်ုပ်တို့သည် ကွက်ကွက်တစ်ခုတွင် ဒေတာဘောင်များစွာမှဒေတာကို ထည့်သွင်းနိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...

[ဆက်လက်ဖတ်ရှုရန်...]

Dplyr- ဒေတာအကျဉ်းချုပ်နည်း၊ ကော်လံအားလုံးကို သိမ်းထားပါ။

အားဖြင့် Benjamin Anderson ဇူလိုင် 15, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

dplyr တွင် summarise() လုပ်ဆောင်ချက်ကို အသုံးပြုသောအခါ၊ summarise() သို့မဟုတ် group_by() လုပ်ဆောင်ချက်များတွင် မပါဝင်သည့် ကိန်းရှင်များကို အလိုအလျောက် ဖယ်ရှားပါမည်။ သို့ရာတွင်၊ သင်သည် ဒေတာဘောင်အတွင်း ကော်လံအားလုံးကို ထိန်းသိမ်းထားစဉ် ဒေတာကို အကျဉ်းချုပ်ရန် mutate() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- ဒေတာကို အကျဉ်းချုပ်သော်လည်း dplyr သုံးပြီး ကော်လံအားလုံးကို သိမ်းထားပါ။ ကျွန်ုပ်တို့တွင် အမျိုးမျိုးသော ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။ #create...

[ဆက်လက်ဖတ်ရှုရန်...]