Category: လမ်းညွှန်
မကြာခဏဆိုသလို သင်သည် မစုံလင်သောကိုက်ညီသော စာကြောင်းများကို အခြေခံ၍ R တွင် ဒေတာနှစ်စုံကို ချိတ်ဆက်လိုပေမည်။ ဒါကို တစ်ခါတရံ fuzzy matching လို့ ခေါ်ပါတယ်။ R တွင် fuzzy matching ပြုလုပ်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ fuzzyjoin package မှ stringdist_join() လုပ်ဆောင်ချက်ကို အသုံးပြုရန်ဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- R တွင် မပီသသော ကိုက်ညီမှု R တွင် အမျိုးမျိုးသော ဘတ်စကက်ဘောအသင်းများအကြောင်း...
မကြာခဏဆိုသလို သင်သည် မစုံလင်သော ကိုက်ညီသော စာကြောင်းများကို အခြေခံ၍ ပန်ဒါများတွင် ဒေတာအတွဲနှစ်ခုကို အတူတကွ ပူးပေါင်းလိုပေမည်။ ဒါကို fuzzy matching လို့ခေါ်တယ်။ ပန်ဒါများတွင် fuzzy matching ပြုလုပ်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ difflib package မှ get_close_matches() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- ပန်ဒါများတွင် မပီမသ စာပေးစာယူ အမျိုးမျိုးသောဘတ်စကက်ဘောအသင်းများအကြောင်းအချက်အလက်ပါရှိသောအောက်ပါပန်ဒါဒေတာဘောင်နှစ်ခုရှိသည်ဆိုကြပါစို့။ import pandas as pd #create two...
ပန်ဒါရှိ GroupBy အရာဝတ္တုတွင် မုဒ်ကို တွက်ချက်ရန် အောက်ပါ syntax ကို သုံးနိုင်သည်- df. groupby ([' group_var '])[' value_var ']. agg ( pd.Series.mode ) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- GroupBy အရာဝတ္ထုတစ်ခုရှိ မုဒ်ကို တွက်ချက်ပါ။ ကျွန်ုပ်တို့တွင် မတူညီသောအသင်းများမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါပန်ဒါ DataFrame ရှိသည်ဆိုပါစို့။ import...
ပန်ဒါရှိ GroupBy အရာဝတ္ထုတစ်ခုရှိ တန်ဖိုးများကို စီစဥ်ရန် အောက်ပါ syntax ကို သင်သုံးနိုင်သည်။ df[' rank '] = df. groupby ([' group_var '])[' value_var ']. rank () အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- GroupBy အရာဝတ္ထုတစ်ခုရှိ အဆင့်သတ်မှတ်ချက်ကို တွက်ချက်ခြင်း။ ကျွန်ုပ်တို့တွင် မတူညီသောအသင်းများမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါပန်ဒါ DataFrame...
ပန်ဒါများတွင် GroupBy ကို အသုံးပြု၍ DataFrame အတန်းများကို အုပ်စုဖွဲ့ရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- ကော်လံတစ်ခုအတွက် စာရင်းတစ်ခုတွင် အတန်းများ အုပ်စုဖွဲ့ပါ။ df. groupby (' group_var ')[' values_var ']. agg ( list ). reset_index (name=' values_var ') နည်းလမ်း 2- ကော်လံများစွာအတွက် စာရင်းတစ်ခုတွင် အုပ်စုလိုက်အတန်းများ df. groupby (' team '). agg...
ပန်ဒါ DataFrame တွင် လအလိုက်တန်းစီရန် အောက်ပါအခြေခံအထားအသိုကိုသုံးနိုင်သည်။ df. groupby (df. your_date_column . dt . month )[' values_column ']. sum () ဤအထူးဖော်မြူလာသည် your_date_column တွင် ရက်စွဲအလိုက် အတန်းများကို အုပ်စုဖွဲ့ပြီး DataFrame ရှိ values_column အတွက် တန်ဖိုးများ၏ ပေါင်းလဒ်များကို တွက်ချက်ပါသည်။ dt.month() လုပ်ဆောင်ချက်သည် ပန်ဒါများရှိ ရက်စွဲကော်လံမှ လကို ထုတ်ယူကြောင်း သတိပြုပါ။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...
ပန်ဒါရှိ အခြားသော variable ဖြင့် အုပ်စုဖွဲ့ထားသော variable ၏ boxes အရေအတွက်ကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။ #define bins groups = df. groupby ([' group_var ', pd. cut (df. value_var , bins)]) #display bin count by group variable groups. size (). unstack () အောက်ဖော်ပြပါ...
GroupBy မှ ပန်ဒါများတွင် မျဥ်းစာများကို ပေါင်းစပ်ရန် အောက်ပါ အခြေခံ အထားအသိုကို သုံးနိုင်သည်။ df. groupby ([' group_var '], as_index= False ). agg ({' string_var ': ' ' .join }) ဤအထူးဖော်မြူလာသည် အတန်းများကို group_var ကော်လံဖြင့် အုပ်စုဖွဲ့ကာ၊ ထို့နောက် string_var ကော်လံရှိ စာကြောင်းများကို ပေါင်းစပ်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင်...
ပန်ဒါများ DataFrame တွင် အတန်းများကို အုပ်စုဖွဲ့ရန် အောက်ပါ syntax ကို သုံးနိုင်ပြီး အုပ်စုများအတွင်း တန်ဖိုးများကို စီရန်- df. sort_values ([' var1 ',' var2 '],ascending= False ). groupby (' var1 '). head () အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- GroupBy ကိုအသုံးပြု၍ Pandas ရှိ Groups...
Pandas DataFrame ရှိ အုပ်စုအလိုက် n အကြီးဆုံးတန်ဖိုးများကိုပြသရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်- #display two largest values by group df. groupby (' group_var ')[' values_var ']. nlargest ( 2 ) ပန်ဒါများ DataFrame ရှိ အုပ်စုတစ်ခုစီအတွက် n အကြီးဆုံးတန်ဖိုးများပေါ်တွင် အချို့သောလုပ်ဆောင်ချက်များ (ပေါင်းလဒ်ယူခြင်းကဲ့သို့) ဆောင်ရွက်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်- #find...