Category: လမ်းညွှန်
ဖိုင်များကို လျင်မြန်လွယ်ကူစွာ တင်သွင်းရန် R ရှိ data.table package ၏ fread() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်- library (data.table) df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ") ဖိုင်ကြီးများအတွက်၊ ဤလုပ်ဆောင်ချက်သည် အခြေခံ R မှ read.csv ကဲ့သို့သော လုပ်ဆောင်ချက်များထက် သိသိသာသာ ပိုမြန်သည်ကို တွေ့ရှိရပါသည်။ ကိစ္စအများစုတွင်၊ ဤလုပ်ဆောင်ချက်သည် သင်တင်သွင်းနေသည့် ဒေတာအတွဲအတွက် ကန့်သတ်ချက်နှင့် ကော်လံအမျိုးအစားများကို အလိုအလျောက် သိရှိနိုင်သည်။...
အဖွဲ့လိုက်လုပ်ဆောင်ရန်နှင့် pandas DataFrame တွင် အခြေအနေအလိုက် ရေတွက်ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df. groupby (' var1 ')[' var2 ']. apply ( lambda x:(x==' val '). sum ()). reset_index (name=' count ') ဤ သီးခြား syntax သည် var1 ကိုအခြေခံ၍ DataFrame ၏အတန်းများကိုစုဖွဲ့ပြီး var2 “ val” နှင့်...
Pandas DataFrame ကော်လံတွင် သတ်မှတ်ထားသော အခြေအနေတစ်ခုဖြင့် တန်ဖိုးအရေအတွက်များကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- အခြေအနေဖြင့် ကော်လံတစ်ခုတွင် တန်ဖိုးများကို ရေတွက်ပါ။ len(df[df[' col1 ']==' value1 ']) နည်းလမ်း 2- အခြေအနေများဖြင့် ကော်လံများစွာတွင် တန်ဖိုးများကို ရေတွက်ပါ။ len(df[(df[' col1 ']==' value1 ') & (df[' col2 ']==' value2 ')]) အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame...
Pandas DataFrame တွင် “ count” ကော်လံတစ်ခုထည့်ရန် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ') ဤ သီးခြား syntax သည် var1_count ဟုခေါ်သော ကော်လံတစ်ခုကို var1 ဟုခေါ်သော ကော်လံတွင် တန်ဖိုးအရေအတွက်များပါရှိသော DataFrame သို့ ပေါင်းထည့်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...
ပန်ဒါ DataFrame ၏ သီးခြားကော်လံများတွင် NaN တန်ဖိုးများကို အစားထိုးရန် အောက်ပါနည်းလမ်းများကို fillna() ဖြင့် အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- သီးခြားကော်လံတစ်ခုဖြင့် fillna() ကိုသုံးပါ။ df[' col1 '] = df[' col1 ']. fillna (0) နည်းလမ်း 2- သီးခြားကော်လံများစွာဖြင့် fillna() ကိုသုံးပါ။ df[[' col1 ', ' col2 ']] = df[[' col1 ', '...
ပန်ဒါဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- ရိုးရှင်းသော ဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားပါ။ ax = df. plot . bar () ax. bar_label ( ax.containers [ 0 ]) နည်းလမ်း 2- အုပ်စုဖွဲ့ထားသော ဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားပါ။ ax = df. plot . bar () for container in...
ကိန်းဂဏန်းစစ်ဆေးမှုများစွာသည် ဒေတာအစုံများကို ပုံမှန်ဖြန့်ဝေသည်ဟု ယူဆသည် ။ Python တွင် ဤယူဆချက်ကို စစ်ဆေးရန် ဘုံနည်းလမ်းလေးခုရှိသည်။ 1. (အမြင်နည်းလမ်း) ဟီစတိုဂရမ်တစ်ခု ဖန်တီးပါ။ ဟီစတိုဂရမ်သည် ခန့်မှန်းခြေအားဖြင့် “ ခေါင်းလောင်း” ပုံသဏ္ဍာန်ဖြစ်ပါက၊ ဒေတာကို ပုံမှန်အတိုင်း ဖြန့်ဝေသည်ဟု ယူဆပါသည်။ 2. (Visual method) QQ ကွက်ကွက်ဖန်တီးပါ။ ကွက်လပ်ပေါ်ရှိ အမှတ်များသည် ဖြောင့်ထောင့်ဖြတ်မျဉ်းတစ်လျှောက် အကြမ်းဖျင်းအားဖြင့် တည်ရှိနေပါက ဒေတာကို ပုံမှန်အတိုင်း ဖြန့်ဝေသည်ဟု ယူဆပါသည်။ 3. (တရားဝင်စာရင်းအင်းစမ်းသပ်မှု) Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်ပါ။...
R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းတစ်ခုကို တွက်ချက်ရန် အောက်ပါ syntax ကို သင်သုံးနိုင်သည်။ library (dplyr) df %>% group_by(group_var) %>% mutate(percent = value_var/sum(value_var)) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းကို တွက်ချက်ပါ။ မတူညီသောအသင်းများမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါဒေတာဘောင်တစ်ခုရှိသည်ဆိုပါစို့။ #create data frame df <-...
ကိန်းဂဏန်းစာရင်းဇယားများတွင် ကြားကာလ နှင့် ကြားကာလအပိုင်းအခြား သည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဖြူးမှုကို တိုင်းတာသည့်နည်းလမ်းနှစ်သွယ်ဖြစ်သည်။ အပိုင်းအခြားသည် ဒေတာအစုံရှိ အနိမ့်ဆုံးတန်ဖိုးနှင့် အမြင့်ဆုံးတန်ဖိုးအကြား ကွာခြားချက်ကို တိုင်းတာသည်။ ဒေတာ အတွဲ တစ်ခုတွင် ပထမ quartile (25th percentile) နှင့် တတိယ quartile (75th percentile) ကြားခြားနားချက်ကို တိုင်းတာသည်။ ၎င်းသည် တန်ဖိုးများ၏ အလယ် 50% ၏ ဖြန့်ဖြူးမှုကို ကိုယ်စားပြုသည်။ ဥပမာ- ကြားကာလနှင့် ကြားကာလအပိုင်းအခြားကို တွက်ချက်နည်း ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။...
စာရင်းဇယားများတွင် အသုံးအများဆုံးလုပ်ထုံးလုပ်နည်းနှစ်ခုမှာ သီအိုရီစမ်းသပ်ခြင်း နှင့် ယုံကြည်မှုကြားကာလများ ဖြစ်သည်။ ဤသည်မှာ ၎င်းတို့နှစ်ခုကြား ခြားနားချက်ဖြစ်သည်- သီအိုရီစစ်ဆေးမှု သည် လူဦးရေကန့်သတ်ချက်နှင့်ပတ်သက်သော ယူဆချက်တစ်ခုဟုတ်မဟုတ် ဆုံးဖြတ်ရန်အသုံးပြုသည့် တရားဝင်စာရင်းအင်းစမ်းသပ်မှုတစ်ခုဖြစ်သည်။ ယုံကြည်မှုကြားကာလ သည် ယုံကြည်စိတ်ချမှုအဆင့်တစ်ခုရှိ လူဦးရေကန့်သတ်ချက်ပါ၀င်နိုင်ခြေရှိသော တန်ဖိုးများအကွာအဝေးတစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာသည် နည်းလမ်းတစ်ခုစီ၏ အကျဉ်းချုပ်ကို ၎င်းတို့၏ တူညီမှုနှင့် ကွဲပြားမှုများနှင့်အတူ မျှဝေထားသည်။ Hypothesis စမ်းသပ်ခြင်း၏အခြေခံများ လူဦးရေကန့်သတ်ချက် နှင့်ပတ်သက်သော ယူဆချက်သည် မှန်ကန်ခြင်းရှိ၊ မရှိ စမ်းသပ်ရန် စမ်းသပ်မှုတစ်ခုအား အသုံးပြုသည်။ လက်တွေ့ကမ္ဘာ သီအိုရီစမ်းသပ်မှုကို လုပ်ဆောင်ရန်၊ သုတေသီများသည်...