Category: လမ်းညွှန်
စာရင်းဇယားများတွင်၊ ကုန်ကြမ်းဒေတာ သည် မူလရင်းမြစ်တစ်ခုမှ တိုက်ရိုက်စုဆောင်းပြီး မည်သည့်နည်းဖြင့်မျှ မလုပ်ဆောင်ရသေးသည့် ဒေတာကို ရည်ညွှန်းသည်။ မည်သည့်ဒေတာခွဲခြမ်းစိတ်ဖြာမှုပရောဂျက်အမျိုးအစားတွင်မဆို ပထမအဆင့်မှာ ဒေတာအကြမ်းစုဆောင်းရန်ဖြစ်သည်။ ဤဒေတာကို စုဆောင်းပြီးသည်နှင့် ၎င်းကို ရှင်းလင်းခြင်း၊ အသွင်ပြောင်းခြင်း၊ အကျဉ်းချုံးပြီး မြင်ယောင်နိုင်မည်ဖြစ်သည်။ ဒေတာအကြမ်းစုဆောင်းခြင်း၏ အားသာချက်မှာ အချို့သောဖြစ်စဉ်များကို ပိုမိုကောင်းမွန်စွာနားလည်ရန် သို့မဟုတ် ကြိုတင်ခန့်မှန်းမှုပုံစံတစ်ခုတည်ဆောက်ရန် ၎င်းကိုအသုံးပြုရန် နောက်ဆုံးတွင် ၎င်းကိုအသုံးပြုရန်ဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဒေတာအကြမ်းများကို စုဆောင်းပြီး လက်တွေ့ဘဝတွင် မည်ကဲ့သို့ အသုံးပြုနိုင်ကြောင်း ဖော်ပြသည်။ ဥပမာ- ဒေတာအကြမ်းစုဆောင်းခြင်းနှင့် အသုံးပြုခြင်း။ အားကစားသည် ဒေတာအကြမ်းများကို...
Correlation ကို variable နှစ်ခုကြားရှိ linear ဆက်စပ်မှုကို တိုင်းတာရန် အသုံးပြုသည်။ ဆက်စပ်ကိန်းဂဏန်းတစ်ခုသည် -1 နှင့် 1 အကြား တန်ဖိုးတစ်ခုကို အမြဲယူသည်- -1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပျက်သဘောဆောင်သော ဆက်စပ်ဆက်နွယ်မှုကို ညွှန်ပြသည်။ 0 သည် variable နှစ်ခုကြားတွင် linear ဆက်စပ်မှုမရှိဟု ညွှန်ပြသည်။ 1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပြုသဘောဆောင်သောမျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။ ကျောင်းသားတွေ မကြာခဏမေးလေ့ရှိတဲ့ မေးခွန်းတစ်ခုကတော့ ဆက်စပ်မှုကို ဘယ်အချိန်မှာ သုံးရမလဲ။ အဖြေတိုတို- variable...
time series plot သည် အချိန်နှင့်အမျှ ပြောင်းလဲနေသော ဒေတာတန်ဖိုးများကို မြင်ယောင်ရန် အသုံးဝင်သည်။ ဤသင်ခန်းစာတွင် Python ရှိ seaborn data visualization package ကို အသုံးပြု၍ အမျိုးမျိုးသော time series ကွက်များကို မည်သို့ဖန်တီးရမည်ကို ရှင်းပြထားသည်။ ဥပမာ 1- တစ်ကြိမ်တည်းကို အတွဲလိုက်ဆွဲပါ။ အောက်ဖော်ပြပါ ကုဒ်သည် Seaborn တွင် တစ်ကြိမ်တည်း စီးရီးတစ်ခုကို မည်သို့ဆွဲရမည်ကို ပြသသည်- import pandas as pd import...
pandas DataFrame မှ histogram တစ်ခုကို ဖန်တီးရန် အောက်ပါ အခြေခံ syntax ကို သင် အသုံးပြုနိုင်ပါသည်။ df. hist (column=' col_name ') အောက်ပါဥပမာများသည် ဤ syntax ကိုလက်တွေ့တွင်မည်သို့အသုံးပြုရမည်ကိုပြသထားသည်။ ဥပမာ 1- တစ်ခုတည်းသော histogram ကိုဆွဲပါ။ အောက်ဖော်ပြပါ ကုဒ်သည် ပန်ဒါ DataFrame ရှိ ကော်လံတစ်ခုအတွက် တစ်ခုတည်းသော ဟီစတိုဂရမ်တစ်ခုကို ဖန်တီးနည်းကို ပြသသည်- import pandas as pd #createDataFrame...
ပန်ဒါ DataFrame တွင် NaN တန်ဖိုးများကို အစားထိုးရန်အတွက် fillna() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်- #replace NaN values in one column df[' col1 '] = df[' col1 ']. fillna (0) #replace NaN values in multiple columns df[[' col1 ', ' col2 ']] =...
DataFrame တစ်ခုထဲသို့ ပန်ဒါနှစ်ကောင် DataFrames ပေါင်းထည့်ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- big_df = pd. concat ([df1, df2], ignore_index= True ) အောက်ဖော်ပြပါ ဥပမာများသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ 1- Pandas DataFrames နှစ်ခုကို ထည့်ပါ။ အောက်ဖော်ပြပါ ကုဒ်သည် ပန်ဒါဘောင်နှစ်ခုကို DataFrame တစ်ခုထဲသို့ ပေါင်းထည့်နည်းကို ပြသသည်- import pandas...
အတန်းနံပါတ်အလိုက် ပန်ဒါ DataFrame ကို များစွာသော DataFrame အဖြစ် ခွဲရန် အောက်ပါအခြေခံ syntax ကို သင်သုံးနိုင်သည်- #split DataFrame into two DataFrames at row 6 df1 = df. iloc [:6] df2 = df. iloc [6:] အောက်ပါဥပမာများသည် ဤ syntax ကိုလက်တွေ့တွင်မည်သို့အသုံးပြုရမည်ကိုပြသထားသည်။ ဥပမာ 1- Pandas DataFrame ကို DataFrame နှစ်ခုအဖြစ်...
ကိန်းဂဏန်းဖြန့်ချီမှုသည် အချို့သောဖြစ်ရပ်တစ်ခုဖြစ်ပေါ်သည်အထိ ကျွန်ုပ်တို့စောင့်ဆိုင်းရမည့်အချိန်ကို နမူနာယူရန် အသုံးပြုသည့် ဖြစ်နိုင်ခြေဖြန့်ဖြူးမှုတစ်ခုဖြစ်သည်။ ကျပန်းပြောင်းလဲနိုင်သော X သည် ကိန်းဂဏန်းဖြန့်ချီမှုတစ်ခုနောက်လိုက်ပါက၊ X ၏ စုစည်းသိပ်သည်းမှုလုပ်ဆောင်ချက်ကို ရေးသားနိုင်သည်- F (x; λ) = 1 – e –λx ရွှေ- λ- နှုန်းသတ်မှတ်ချက် (λ = 1/μ အဖြစ် တွက်ချက်) e- ခန့်မှန်းခြေ ကိန်းသေတစ်ခုသည် 2.718 နှင့် ညီမျှသည်။ ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် လက်တွေ့ဘဝတွင် ထပ်ကိန်းထုတ်ခြင်း၏ ဥပမာ...
ပန်ဒါများတွင် VLOOKUP (Excel နှင့်ဆင်တူသည်) လုပ်ဆောင်ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- p.d. merge (df1, df2, on = ' column_name ', how = ' left ') အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ အဆင့် 1- DataFrames နှစ်ခုဖန်တီးပါ။ ပထမဦးစွာ ပန်ဒါများကို တင်သွင်းပြီး ပန်ဒါ DataFrames...
scatterplot matrix သည် ၎င်းနှင့်တူသည် – scatterplot matrix။ ဤ matrix အမျိုးအစားသည် ဒေတာအစုံရှိ ကိန်းရှင်များစွာကြားရှိ ဆက်စပ်မှုကို တစ်ပြိုင်နက် မြင်ယောင်နိုင်စေသောကြောင့် အသုံးဝင်ပါသည်။ ပန်ဒါဒေတာဘောင်တစ်ခုမှ scatter matrix ကိုဖန်တီးရန် scatter_matrix() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်- p.d. plotting . scatter_matrix (df) အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame နှင့် လက်တွေ့တွင် ဤ syntax ကိုမည်သို့အသုံးပြုရမည်ကို ပြသသည် ။ import pandas...