Category: လမ်းညွှန်

R တွင် fuzzy matching ပြုလုပ်နည်း (ဥပမာဖြင့်)

မကြာခဏဆိုသလို သင်သည် မစုံလင်သောကိုက်ညီသော စာကြောင်းများကို အခြေခံ၍ R တွင် ဒေတာနှစ်စုံကို ချိတ်ဆက်လိုပေမည်။ ဒါကို တစ်ခါတရံ fuzzy matching လို့ ခေါ်ပါတယ်။ R တွင် fuzzy matching ပြုလုပ်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ fuzzyjoin package မှ stringdist_join() လုပ်ဆောင်ချက်ကို အသုံးပြုရန်ဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- R တွင် မပီသသော ကိုက်ညီမှု R တွင် အမျိုးမျိုးသော ဘတ်စကက်ဘောအသင်းများအကြောင်း...

Pandas တွင် fuzzy matching ပြုလုပ်နည်း (ဥပမာဖြင့်)

မကြာခဏဆိုသလို သင်သည် မစုံလင်သော ကိုက်ညီသော စာကြောင်းများကို အခြေခံ၍ ပန်ဒါများတွင် ဒေတာအတွဲနှစ်ခုကို အတူတကွ ပူးပေါင်းလိုပေမည်။ ဒါကို fuzzy matching လို့ခေါ်တယ်။ ပန်ဒါများတွင် fuzzy matching ပြုလုပ်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ difflib package မှ get_close_matches() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- ပန်ဒါများတွင် မပီမသ စာပေးစာယူ အမျိုးမျိုးသောဘတ်စကက်ဘောအသင်းများအကြောင်းအချက်အလက်ပါရှိသောအောက်ပါပန်ဒါဒေတာဘောင်နှစ်ခုရှိသည်ဆိုကြပါစို့။ import pandas as pd #create two...

Pandas- groupby အရာဝတ္ထုတစ်ခုရှိ မုဒ်ကို တွက်ချက်နည်း

ပန်ဒါရှိ GroupBy အရာဝတ္တုတွင် မုဒ်ကို တွက်ချက်ရန် အောက်ပါ syntax ကို သုံးနိုင်သည်- df. groupby ([' group_var '])[' value_var ']. agg ( pd.Series.mode ) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- GroupBy အရာဝတ္ထုတစ်ခုရှိ မုဒ်ကို တွက်ချက်ပါ။ ကျွန်ုပ်တို့တွင် မတူညီသောအသင်းများမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါပန်ဒါ DataFrame ရှိသည်ဆိုပါစို့။ import...

Pandas- groupby အရာဝတ္ထုတစ်ခုရှိ အဆင့်သတ်မှတ်ချက်ကို တွက်ချက်နည်း

ပန်ဒါရှိ GroupBy အရာဝတ္ထုတစ်ခုရှိ တန်ဖိုးများကို စီစဥ်ရန် အောက်ပါ syntax ကို သင်သုံးနိုင်သည်။ df[' rank '] = df. groupby ([' group_var '])[' value_var ']. rank () အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- GroupBy အရာဝတ္ထုတစ်ခုရှိ အဆင့်သတ်မှတ်ချက်ကို တွက်ချက်ခြင်း။ ကျွန်ုပ်တို့တွင် မတူညီသောအသင်းများမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါပန်ဒါ DataFrame...

Pandas- groupby ကို အသုံးပြု၍ စာရင်းတစ်ခုတွင် တန်းစီနည်း

ပန်ဒါများတွင် GroupBy ကို အသုံးပြု၍ DataFrame အတန်းများကို အုပ်စုဖွဲ့ရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- ကော်လံတစ်ခုအတွက် စာရင်းတစ်ခုတွင် အတန်းများ အုပ်စုဖွဲ့ပါ။ df. groupby (' group_var ')[' values_var ']. agg ( list ). reset_index (name=' values_var ') နည်းလမ်း 2- ကော်လံများစွာအတွက် စာရင်းတစ်ခုတွင် အုပ်စုလိုက်အတန်းများ df. groupby (' team '). agg...

Pandas dataframe တွင် လအလိုက် အုပ်စုဖွဲ့နည်း (ဥပမာနှင့်အတူ)

ပန်ဒါ DataFrame တွင် လအလိုက်တန်းစီရန် အောက်ပါအခြေခံအထားအသိုကိုသုံးနိုင်သည်။ df. groupby (df. your_date_column . dt . month )[' values_column ']. sum () ဤအထူးဖော်မြူလာသည် your_date_column တွင် ရက်စွဲအလိုက် အတန်းများကို အုပ်စုဖွဲ့ပြီး DataFrame ရှိ values_column အတွက် တန်ဖိုးများ၏ ပေါင်းလဒ်များကို တွက်ချက်ပါသည်။ dt.month() လုပ်ဆောင်ချက်သည် ပန်ဒါများရှိ ရက်စွဲကော်လံမှ လကို ထုတ်ယူကြောင်း သတိပြုပါ။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...

Pandas- bin အရေအတွက်ဖြင့် groupby ကိုအသုံးပြုနည်း

ပန်ဒါရှိ အခြားသော variable ဖြင့် အုပ်စုဖွဲ့ထားသော variable ၏ boxes အရေအတွက်ကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။ #define bins groups = df. groupby ([' group_var ', pd. cut (df. value_var , bins)]) #display bin count by group variable groups. size (). unstack () အောက်ဖော်ပြပါ...

Pandas- groupby ကို အသုံးပြု၍ စာကြောင်းများ ပေါင်းစပ်နည်း

GroupBy မှ ပန်ဒါများတွင် မျဥ်းစာများကို ပေါင်းစပ်ရန် အောက်ပါ အခြေခံ အထားအသိုကို သုံးနိုင်သည်။ df. groupby ([' group_var '], as_index= False ). agg ({' string_var ': ' ' .join }) ဤအထူးဖော်မြူလာသည် အတန်းများကို group_var ကော်လံဖြင့် အုပ်စုဖွဲ့ကာ၊ ထို့နောက် string_var ကော်လံရှိ စာကြောင်းများကို ပေါင်းစပ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင်...

Pandas- အုပ်စုများအတွင်း groupby & sort ကိုအသုံးပြုနည်း

ပန်ဒါများ DataFrame တွင် အတန်းများကို အုပ်စုဖွဲ့ရန် အောက်ပါ syntax ကို သုံးနိုင်ပြီး အုပ်စုများအတွင်း တန်ဖိုးများကို စီရန်- df. sort_values ([' var1 ',' var2 '],ascending= False ). groupby (' var1 '). head () အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- GroupBy ကိုအသုံးပြု၍ Pandas ရှိ Groups...

Pandas- nlargest() ဖြင့် groupby အသုံးပြုနည်း

Pandas DataFrame ရှိ အုပ်စုအလိုက် n အကြီးဆုံးတန်ဖိုးများကိုပြသရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်- #display two largest values by group df. groupby (' group_var ')[' values_var ']. nlargest ( 2 ) ပန်ဒါများ DataFrame ရှိ အုပ်စုတစ်ခုစီအတွက် n အကြီးဆုံးတန်ဖိုးများပေါ်တွင် အချို့သောလုပ်ဆောင်ချက်များ (ပေါင်းလဒ်ယူခြင်းကဲ့သို့) ဆောင်ရွက်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်- #find...