Category: လမ်းညွှန်

ဖိုင်များကိုပိုမိုမြန်ဆန်စွာတင်သွင်းရန် r တွင် fread() ကိုအသုံးပြုနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ဖိုင်များကို လျင်မြန်လွယ်ကူစွာ တင်သွင်းရန် R ရှိ data.table package ၏ fread() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်- library (data.table) df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ") ဖိုင်ကြီးများအတွက်၊ ဤလုပ်ဆောင်ချက်သည် အခြေခံ R မှ read.csv ကဲ့သို့သော လုပ်ဆောင်ချက်များထက် သိသိသာသာ ပိုမြန်သည်ကို တွေ့ရှိရပါသည်။ ကိစ္စအများစုတွင်၊ ဤလုပ်ဆောင်ချက်သည် သင်တင်သွင်းနေသည့် ဒေတာအတွဲအတွက် ကန့်သတ်ချက်နှင့် ကော်လံအမျိုးအစားများကို အလိုအလျောက် သိရှိနိုင်သည်။...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas- groupby ကိုအသုံးပြုနည်းနှင့် အခြေအနေအရ ရေတွက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

အဖွဲ့လိုက်လုပ်ဆောင်ရန်နှင့် pandas DataFrame တွင် အခြေအနေအလိုက် ရေတွက်ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df. groupby (' var1 ')[' var2 ']. apply ( lambda x:(x==' val '). sum ()). reset_index (name=' count ') ဤ သီးခြား syntax သည် var1 ကိုအခြေခံ၍ DataFrame ၏အတန်းများကိုစုဖွဲ့ပြီး var2 “ val” နှင့်...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas- အခြေအနေဖြင့် ကော်လံတစ်ခုတွင် တန်ဖိုးများကို ရေတွက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Pandas DataFrame ကော်လံတွင် သတ်မှတ်ထားသော အခြေအနေတစ်ခုဖြင့် တန်ဖိုးအရေအတွက်များကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- အခြေအနေဖြင့် ကော်လံတစ်ခုတွင် တန်ဖိုးများကို ရေတွက်ပါ။ len(df[df[' col1 ']==' value1 ']) နည်းလမ်း 2- အခြေအနေများဖြင့် ကော်လံများစွာတွင် တန်ဖိုးများကို ရေတွက်ပါ။ len(df[(df[' col1 ']==' value1 ') & (df[' col2 ']==' value2 ')]) အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas dataframe တွင် နံပါတ်ကော်လံတစ်ခုကို မည်သို့ထည့်မည်နည်း။

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Pandas DataFrame တွင် “ count” ကော်လံတစ်ခုထည့်ရန် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ') ဤ သီးခြား syntax သည် var1_count ဟုခေါ်သော ကော်လံတစ်ခုကို var1 ဟုခေါ်သော ကော်လံတွင် တန်ဖိုးအရေအတွက်များပါရှိသော DataFrame သို့ ပေါင်းထည့်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas- သီးခြားကော်လံများနှင့်အတူ fillna() ကိုအသုံးပြုနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ပန်ဒါ DataFrame ၏ သီးခြားကော်လံများတွင် NaN တန်ဖိုးများကို အစားထိုးရန် အောက်ပါနည်းလမ်းများကို fillna() ဖြင့် အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- သီးခြားကော်လံတစ်ခုဖြင့် fillna() ကိုသုံးပါ။ df[' col1 '] = df[' col1 ']. fillna (0) နည်းလမ်း 2- သီးခြားကော်လံများစွာဖြင့် fillna() ကိုသုံးပါ။ df[[' col1 ', ' col2 ']] = df[[' col1 ', '...

[ဆက်လက်ဖတ်ရှုရန်...]

Pandas- ဘားကွက်တစ်ခုတွင် ဘားများကို မှတ်သားနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ပန်ဒါဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- ရိုးရှင်းသော ဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားပါ။ ax = df. plot . bar () ax. bar_label ( ax.containers [ 0 ]) နည်းလမ်း 2- အုပ်စုဖွဲ့ထားသော ဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားပါ။ ax = df. plot . bar () for container in...

[ဆက်လက်ဖတ်ရှုရန်...]

Python တွင် normality ကိုစမ်းသပ်နည်း (နည်းလမ်း 4 ခု)

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ကိန်းဂဏန်းစစ်ဆေးမှုများစွာသည် ဒေတာအစုံများကို ပုံမှန်ဖြန့်ဝေသည်ဟု ယူဆသည် ။ Python တွင် ဤယူဆချက်ကို စစ်ဆေးရန် ဘုံနည်းလမ်းလေးခုရှိသည်။ 1. (အမြင်နည်းလမ်း) ဟီစတိုဂရမ်တစ်ခု ဖန်တီးပါ။ ဟီစတိုဂရမ်သည် ခန့်မှန်းခြေအားဖြင့် “ ခေါင်းလောင်း” ပုံသဏ္ဍာန်ဖြစ်ပါက၊ ဒေတာကို ပုံမှန်အတိုင်း ဖြန့်ဝေသည်ဟု ယူဆပါသည်။ 2. (Visual method) QQ ကွက်ကွက်ဖန်တီးပါ။ ကွက်လပ်ပေါ်ရှိ အမှတ်များသည် ဖြောင့်ထောင့်ဖြတ်မျဉ်းတစ်လျှောက် အကြမ်းဖျင်းအားဖြင့် တည်ရှိနေပါက ဒေတာကို ပုံမှန်အတိုင်း ဖြန့်ဝေသည်ဟု ယူဆပါသည်။ 3. (တရားဝင်စာရင်းအင်းစမ်းသပ်မှု) Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်ပါ။...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းတွက်ချက်နည်း (ဥပမာနှင့်အတူ)

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းတစ်ခုကို တွက်ချက်ရန် အောက်ပါ syntax ကို သင်သုံးနိုင်သည်။ library (dplyr) df %>% group_by(group_var) %>% mutate(percent = value_var/sum(value_var)) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းကို တွက်ချက်ပါ။ မတူညီသောအသင်းများမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါဒေတာဘောင်တစ်ခုရှိသည်ဆိုပါစို့။ #create data frame df <-...

[ဆက်လက်ဖတ်ရှုရန်...]

ကြားကာလ vs. interquartile range- ကွာခြားချက်ကဘာလဲ။

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ကိန်းဂဏန်းစာရင်းဇယားများတွင် ကြားကာလ နှင့် ကြားကာလအပိုင်းအခြား သည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဖြူးမှုကို တိုင်းတာသည့်နည်းလမ်းနှစ်သွယ်ဖြစ်သည်။ အပိုင်းအခြားသည် ဒေတာအစုံရှိ အနိမ့်ဆုံးတန်ဖိုးနှင့် အမြင့်ဆုံးတန်ဖိုးအကြား ကွာခြားချက်ကို တိုင်းတာသည်။ ဒေတာ အတွဲ တစ်ခုတွင် ပထမ quartile (25th percentile) နှင့် တတိယ quartile (75th percentile) ကြားခြားနားချက်ကို တိုင်းတာသည်။ ၎င်းသည် တန်ဖိုးများ၏ အလယ် 50% ၏ ဖြန့်ဖြူးမှုကို ကိုယ်စားပြုသည်။ ဥပမာ- ကြားကာလနှင့် ကြားကာလအပိုင်းအခြားကို တွက်ချက်နည်း ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။...

[ဆက်လက်ဖတ်ရှုရန်...]

ယူဆချက်စမ်းသပ်ခြင်းနှင့် ယုံကြည်မှုကြားကာလ- ကွာခြားချက်မှာ အဘယ်နည်း။

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

စာရင်းဇယားများတွင် အသုံးအများဆုံးလုပ်ထုံးလုပ်နည်းနှစ်ခုမှာ သီအိုရီစမ်းသပ်ခြင်း နှင့် ယုံကြည်မှုကြားကာလများ ဖြစ်သည်။ ဤသည်မှာ ၎င်းတို့နှစ်ခုကြား ခြားနားချက်ဖြစ်သည်- သီအိုရီစစ်ဆေးမှု သည် လူဦးရေကန့်သတ်ချက်နှင့်ပတ်သက်သော ယူဆချက်တစ်ခုဟုတ်မဟုတ် ဆုံးဖြတ်ရန်အသုံးပြုသည့် တရားဝင်စာရင်းအင်းစမ်းသပ်မှုတစ်ခုဖြစ်သည်။ ယုံကြည်မှုကြားကာလ သည် ယုံကြည်စိတ်ချမှုအဆင့်တစ်ခုရှိ လူဦးရေကန့်သတ်ချက်ပါ၀င်နိုင်ခြေရှိသော တန်ဖိုးများအကွာအဝေးတစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာသည် နည်းလမ်းတစ်ခုစီ၏ အကျဉ်းချုပ်ကို ၎င်းတို့၏ တူညီမှုနှင့် ကွဲပြားမှုများနှင့်အတူ မျှဝေထားသည်။ Hypothesis စမ်းသပ်ခြင်း၏အခြေခံများ လူဦးရေကန့်သတ်ချက် နှင့်ပတ်သက်သော ယူဆချက်သည် မှန်ကန်ခြင်းရှိ၊ မရှိ စမ်းသပ်ရန် စမ်းသပ်မှုတစ်ခုအား အသုံးပြုသည်။ လက်တွေ့ကမ္ဘာ သီအိုရီစမ်းသပ်မှုကို လုပ်ဆောင်ရန်၊ သုတေသီများသည်...

[ဆက်လက်ဖတ်ရှုရန်...]