Sas တွင် fuzzy matching ပြုလုပ်နည်း (ဥပမာဖြင့်)
မကြာခဏ၊ သင်သည် မစုံလင်သော ကိုက်ညီသော စာကြောင်းများကို အခြေခံ၍ SAS တွင် ဒေတာနှစ်စုံ ပါဝင်လိုပေမည်။
ဒါကို fuzzy matching လို့ ခေါ်ပါတယ်။
SAS တွင် fuzzy matching ပြုလုပ်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ COMPGED လုပ်ဆောင်ချက်ဖြင့် SOUNDEX လုပ်ဆောင်ချက်ကို အသုံးပြုရန်ဖြစ်သည်။
ဤလုပ်ဆောင်ချက်နှစ်ခုကို strings များကြားရှိ ဆင်တူမှုများကို တွက်ချက်ရန်အတွက် အသုံးပြုပြီး အလားတူ strings များကို “ match” ရန်အတွက် အသုံးပြုနိုင်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် SAS တွင် fuzzy matching လုပ်ဆောင်ရန် ဤလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ပြသထားသည်။
ဥပမာ- SAS တွင် fuzzy matching လုပ်နည်း
ကျွန်ုပ်တို့တွင် ဘတ်စကတ်ဘောကစားသမားအမျိုးမျိုး၏ အသင်းအမည်များနှင့် အမှတ်များအကြောင်း အချက်အလက်များပါရှိသော SAS တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။
/*create first dataset*/
data data1;
input team $points;
datalines ;
Mavs 19
Nets 22
Kings 34
Warriors 19
Magic 32
;
run ;
/*view dataset*/
proc print data =data1;
အသင်းအမည်များနှင့် ဘတ်စကက်ဘောကစားသမားများ၏ ပံ့ပိုးကူညီမှုဆိုင်ရာ အခြားဒေတာအတွဲတစ်ခုရှိသည်ဆိုပါစို့။
/*create second dataset*/
data data2;
input team $assists;
datalines ;
Netts 8
Majick 7
Keengs 8
Warriors 12
Mavs 4
;
run ;
/*view dataset*/
proc print data =data2;
ဤဒေတာအတွဲရှိ အဖွဲ့အမည်များစွာသည် ဆင်တူသော်လည်း ယခင်ဒေတာအတွဲရှိ အဖွဲ့အမည်များနှင့် အတိအကျမတူကြောင်း သတိပြုပါ။
SAS တွင် အောက်ပါ syntax ကို အသုံးပြု၍ ရှုပ်ထွေးသော ပွဲစဉ်တစ်ခုကို လုပ်ဆောင်ရန်နှင့် အလားတူ အဖွဲ့အမည်များကို အခြေခံ၍ ဤဒေတာအတွဲနှစ်ခုကို အတူတကွ သယ်ဆောင်နိုင်သည်-
/*use fuzzy matching to merge datasets based on similar team names*/ data data3; setdata1 ; tmp1= soundex (team); /*encode team names from data1 */ do i=1 to nobs; set data2( rename =(team=team2)) point =i nobs =nobs; tmp2= soundex (team2); /*encode team names from data2* / dif= compged (tmp1,tmp2); /*determine similarity between team names */ if dif<=50 then do ; drop i tmp1 tmp2 dif; /*dr op unnecessary variables*/ output ; end ; end ; run ; /*view resulting dataset*/ proc print data=data3;
SOUNDEX နှင့် COMPGED လုပ်ဆောင်ချက်များသည် ၎င်းတို့၏ဆင်တူမှုအပေါ်အခြေခံ၍ အဖွဲ့အမည်များကို ယှဉ်တွဲနိုင်ပြီး ဒေတာအတွဲနှစ်ခုကို ပေါင်းစပ်ထားသည့် နောက်ဆုံးဒေတာအတွဲကို ထုတ်လုပ်နိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် SAS တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
SAS – တစ်ခုမှတစ်ခုသို့ အများအပြား ပေါင်းစည်းခြင်းကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
SAS- ပေါင်းစပ်ထုတ်ပြန်ချက်တွင် (in=a) ကိုအသုံးပြုနည်း
SAS : A က B မဟုတ်ရင် ဘယ်လိုပေါင်းမလဲ။