Cara menghitung kesamaan kosinus dengan python
Kemiripan kosinus adalah ukuran kemiripan antara dua vektor pada ruang hasil kali dalam.
Untuk dua vektor, A dan B, persamaan cosinus dihitung sebagai berikut:
Kemiripan kosinus = ΣA i B i / (√ΣA i 2 √ΣB i 2 )
Tutorial ini menjelaskan cara menghitung kesamaan kosinus antar vektor dengan Python menggunakan fungsi dari perpustakaan NumPy .
Kesamaan kosinus antara dua vektor dengan Python
Kode berikut menunjukkan cara menghitung kesamaan kosinus antara dua array dengan Python:
from numpy import dot from numpy. linalg import norm #define arrays a = [23, 34, 44, 45, 42, 27, 33, 34] b = [17, 18, 22, 26, 26, 29, 31, 30] #calculate Cosine Similarity cos_sim = dot (a, b)/( norm (a)* norm (b)) cos_sim 0.965195008357566
Kemiripan kosinus kedua tabel tersebut ternyata adalah 0,965195 .
Perhatikan bahwa metode ini akan bekerja pada dua array dengan panjang berapa pun:
import numpy as np from numpy import dot from numpy. linalg import norm #define arrays a = np.random.randint(10, size= 100 ) b = np.random.randint(10, size= 100 ) #calculate Cosine Similarity cos_sim = dot (a, b)/( norm (a)* norm (b)) cos_sim 0.7340201613960431
Namun, ini hanya berfungsi jika kedua array memiliki panjang yang sama:
import numpy as np from numpy import dot from numpy. linalg import norm #define arrays a = np.random.randint(10, size= 90 ) #length=90 b = np.random.randint(10, size= 100 ) #length=100 #calculate Cosine Similarity cos_sim = dot (a, b)/( norm (a)* norm (b)) cos_sim ValueError : shapes (90,) and (100,) not aligned: 90 (dim 0) != 100 (dim 0)
Komentar
1. Ada beberapa cara untuk menghitung kesamaan kosinus menggunakan Python, tetapi seperti yang dijelaskan dalam thread Stack Overflow ini , metode yang dijelaskan dalam artikel ini ternyata adalah yang tercepat.
2. Lihathalaman Wikipedia ini untuk mempelajari lebih lanjut tentang kesamaan kosinus.