Cara menghitung jarak levenshtein dengan python


Jarak Levenshtein antara dua string adalah jumlah minimum perubahan karakter tunggal yang diperlukan untuk mengubah satu kata menjadi kata lain.

Yang dimaksud dengan “modifikasi” meliputi penggantian, penyisipan, dan penghapusan.

Misalnya, kita mempunyai dua kata berikut:

  • KE PESTA
  • TAMAN

Jarak Levenshtein antara dua kata (yaitu jumlah perubahan yang perlu kita lakukan untuk mengubah satu kata menjadi kata lainnya) adalah 2 :

Contoh jarak Levenshtein

Dalam praktiknya, jarak Levenshtein digunakan dalam banyak aplikasi berbeda, termasuk pencocokan string fuzzy, pemeriksaan ejaan, dan pemrosesan bahasa alami.

Tutorial ini menjelaskan cara menghitung jarak Levenshtein antar string dengan Python menggunakan modul python-Levenshtein.

Anda dapat menggunakan sintaks berikut untuk menginstal modul ini:

 pip install python-Levenshtein

Anda kemudian dapat memuat fungsi untuk menghitung jarak Levenshtein:

 from Levenshtein import distance as lev

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh 1: Jarak Levenshtein antara dua senar

Kode berikut menunjukkan cara menghitung jarak Levenshtein antara dua string “party” dan “park”:

 #calculate Levenshtein distance
lev(' party ', ' park ')

2

Jarak Levenshtein ternyata 2 .

Contoh 2: Jarak Levenshtein antara dua tabel

Kode berikut menunjukkan cara menghitung jarak Levenshtein antara setiap kombinasi string berpasangan dalam dua array berbeda:

 #define arrays
a = ['Mavs', 'Spurs', 'Lakers', 'Cavs']
b <- ['Rockets', 'Pacers', 'Warriors', 'Celtics']

#calculate Levenshtein distance between two arrays
for i,k in zip (a,b):
  print (lev(i, k))

6
4
5
5

Cara menafsirkan hasilnya adalah sebagai berikut:

  • Jarak Levenshtein antara “Mavs” dan “Rockets” adalah 6 .
  • Jarak Levenshtein antara “Spurs” dan “Pacers” adalah 4 .
  • Jarak Levenshtein antara “Lakers” dan “Warriors” adalah 5 .
  • Jarak Levenshtein antara “Cavs” dan “Celtics” adalah 5 .

Sumber daya tambahan

Cara Menghitung Jarak Hamming dengan Python
Cara menghitung jarak Euclidean dengan Python
Cara Menghitung Jarak Mahalanobis dengan Python

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *