Python ရှိ levenshtein အကွာအဝေးကို တွက်နည်း


ကြိုးတန်းနှစ်ခုကြားရှိ Levenshtein အကွာအဝေး သည် စကားလုံးတစ်လုံးမှ အခြားတစ်လုံးသို့ ပြောင်းလဲရန် လိုအပ်သော စာလုံးတစ်လုံးတည်းပြောင်းလဲမှု၏ အနည်းဆုံးအရေအတွက်ဖြစ်သည်။

“ မွမ်းမံမှုများ” ဟူသော စကားလုံးတွင် အစားထိုးခြင်း၊ ထည့်သွင်းခြင်းနှင့် ဖျက်ခြင်းများ ပါဝင်သည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါစကားလုံးနှစ်လုံးရှိသည်ဆိုပါစို့။

  • ပါတီသို့
  • ပန်းခြံ

စကားလုံးနှစ်လုံးကြားရှိ Levenshtein အကွာအဝေး (ဆိုလိုသည်မှာ စကားလုံးတစ်လုံးမှ အခြားတစ်လုံးသို့ ပြောင်းလဲရန် ကျွန်ုပ်တို့ပြုလုပ်ရမည့် အပြောင်းအလဲအရေအတွက်) သည် 2 ဖြစ်လိမ့်မည်။

Levenshtein အကွာအဝေး၏ဥပမာ

လက်တွေ့တွင်၊ Levenshtein အကွာအဝေးကို fuzzy string matching၊ spell checking နှင့် natural language processing အပါအဝင် မတူညီသော application အများအပြားတွင် အသုံးပြုပါသည်။

ဤသင်ခန်းစာသည် python-Levenshtein module ကို အသုံးပြု၍ Python ရှိ စာကြောင်းများကြားရှိ Levenshtein အကွာအဝေးကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။

ဤ module ကိုထည့်သွင်းရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-

 pip install python-Levenshtein

ထို့နောက် Levenshtein အကွာအဝေးကိုတွက်ချက်ရန် လုပ်ဆောင်ချက်ကို သင်တင်နိုင်သည်-

 from Levenshtein import distance as lev

အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1- ကြိုးနှစ်ခုကြားရှိ Levenshtein အကွာအဝေး

အောက်ပါကုဒ်သည် “party” နှင့် “park” ကြိုးနှစ်ခုကြားရှိ Levenshtein အကွာအဝေးကို တွက်ချက်နည်းကို ပြသသည်-

 #calculate Levenshtein distance
lev(' party ', ' park ')

2

Levenshtein အကွာအဝေးသည် 2 ဖြစ်သည် ။

ဥပမာ 2- ဇယားနှစ်ခုကြားရှိ Levenshtein အကွာအဝေး

အောက်ပါကုဒ်သည် မတူညီသော array နှစ်ခုတွင် မျဉ်းတွဲတစ်ခုစီ၏ အတွဲလိုက်ပေါင်းစပ်မှုကြားရှိ Levenshtein အကွာအဝေးကို တွက်ချက်နည်းကို ပြသသည်-

 #define arrays
a = ['Mavs', 'Spurs', 'Lakers', 'Cavs']
b <- ['Rockets', 'Pacers', 'Warriors', 'Celtics']

#calculate Levenshtein distance between two arrays
for i,k in zip (a,b):
  print (lev(i, k))

6
4
5
5

ရလဒ်ကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • “ Mavs” နှင့် “ Rockets” အကြား Levenshtein အကွာအဝေးသည် 6 ဖြစ်သည်။
  • “ စပါး” နှင့် “ ပါဆာ” အကြား Levenshtein အကွာအဝေးသည် 4 ဖြစ်သည်။
  • “ Lakers” နှင့် “ Warriors” အကြား Levenshtein အကွာအဝေးသည် 5 ဖြစ်သည်။
  • “ Cavs” နှင့် “ Celtics” အကြား Levenshtein အကွာအဝေးသည် 5 ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

Python တွင် Hamming Distance ကို တွက်နည်း
Python တွင် Euclidean အကွာအဝေးကို တွက်နည်း
Python ရှိ Mahalanobis အကွာအဝေးကို တွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်