Python ရှိ levenshtein အကွာအဝေးကို တွက်နည်း
ကြိုးတန်းနှစ်ခုကြားရှိ Levenshtein အကွာအဝေး သည် စကားလုံးတစ်လုံးမှ အခြားတစ်လုံးသို့ ပြောင်းလဲရန် လိုအပ်သော စာလုံးတစ်လုံးတည်းပြောင်းလဲမှု၏ အနည်းဆုံးအရေအတွက်ဖြစ်သည်။
“ မွမ်းမံမှုများ” ဟူသော စကားလုံးတွင် အစားထိုးခြင်း၊ ထည့်သွင်းခြင်းနှင့် ဖျက်ခြင်းများ ပါဝင်သည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါစကားလုံးနှစ်လုံးရှိသည်ဆိုပါစို့။
- ပါတီသို့
- ပန်းခြံ
စကားလုံးနှစ်လုံးကြားရှိ Levenshtein အကွာအဝေး (ဆိုလိုသည်မှာ စကားလုံးတစ်လုံးမှ အခြားတစ်လုံးသို့ ပြောင်းလဲရန် ကျွန်ုပ်တို့ပြုလုပ်ရမည့် အပြောင်းအလဲအရေအတွက်) သည် 2 ဖြစ်လိမ့်မည်။
လက်တွေ့တွင်၊ Levenshtein အကွာအဝေးကို fuzzy string matching၊ spell checking နှင့် natural language processing အပါအဝင် မတူညီသော application အများအပြားတွင် အသုံးပြုပါသည်။
ဤသင်ခန်းစာသည် python-Levenshtein module ကို အသုံးပြု၍ Python ရှိ စာကြောင်းများကြားရှိ Levenshtein အကွာအဝေးကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။
ဤ module ကိုထည့်သွင်းရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-
pip install python-Levenshtein
ထို့နောက် Levenshtein အကွာအဝေးကိုတွက်ချက်ရန် လုပ်ဆောင်ချက်ကို သင်တင်နိုင်သည်-
from Levenshtein import distance as lev
အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ 1- ကြိုးနှစ်ခုကြားရှိ Levenshtein အကွာအဝေး
အောက်ပါကုဒ်သည် “party” နှင့် “park” ကြိုးနှစ်ခုကြားရှိ Levenshtein အကွာအဝေးကို တွက်ချက်နည်းကို ပြသသည်-
#calculate Levenshtein distance lev(' party ', ' park ') 2
Levenshtein အကွာအဝေးသည် 2 ဖြစ်သည် ။
ဥပမာ 2- ဇယားနှစ်ခုကြားရှိ Levenshtein အကွာအဝေး
အောက်ပါကုဒ်သည် မတူညီသော array နှစ်ခုတွင် မျဉ်းတွဲတစ်ခုစီ၏ အတွဲလိုက်ပေါင်းစပ်မှုကြားရှိ Levenshtein အကွာအဝေးကို တွက်ချက်နည်းကို ပြသသည်-
#define arrays a = ['Mavs', 'Spurs', 'Lakers', 'Cavs'] b <- ['Rockets', 'Pacers', 'Warriors', 'Celtics'] #calculate Levenshtein distance between two arrays for i,k in zip (a,b): print (lev(i, k)) 6 4 5 5
ရလဒ်ကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- “ Mavs” နှင့် “ Rockets” အကြား Levenshtein အကွာအဝေးသည် 6 ဖြစ်သည်။
- “ စပါး” နှင့် “ ပါဆာ” အကြား Levenshtein အကွာအဝေးသည် 4 ဖြစ်သည်။
- “ Lakers” နှင့် “ Warriors” အကြား Levenshtein အကွာအဝေးသည် 5 ဖြစ်သည်။
- “ Cavs” နှင့် “ Celtics” အကြား Levenshtein အကွာအဝေးသည် 5 ဖြစ်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
Python တွင် Hamming Distance ကို တွက်နည်း
Python တွင် Euclidean အကွာအဝေးကို တွက်နည်း
Python ရှိ Mahalanobis အကွာအဝေးကို တွက်နည်း