R'de jaccard benzerliği nasıl hesaplanır

İle Dr.benjamin anderson Temmuz 27, 2023 Rehber 0 Yorum

Jaccard benzerlik indeksi iki veri kümesi arasındaki benzerliği ölçer. 0 ila 1 arasında değişebilir. Sayı ne kadar yüksek olursa, iki veri kümesi de o kadar benzer olur.

Jaccard benzerlik indeksi şu şekilde hesaplanır:

Jaccard benzerliği = (her iki kümedeki gözlem sayısı) / (her iki kümedeki sayı)

Veya notasyon biçiminde yazılmış:

J(A, B) = |A∩B| / |A∪B|

Bu eğitimde, R’deki iki veri kümesi için Jaccard benzerliğinin nasıl hesaplanacağı açıklanmaktadır.

Örnek: R’deki Jaccard benzerliği

Aşağıdaki iki veri kümesine sahip olduğumuzu varsayalım:

 a <- c(0, 1, 2, 5, 6, 8, 9)
b <- c(0, 2, 3, 4, 5, 7, 9)

İki küme arasındaki Jaccard benzerliğini hesaplamak için aşağıdaki fonksiyonu tanımlayabiliriz:

 #define Jaccard Similarity function
jaccard <- function (a, b) {
    intersection = length ( intersect (a,b))
    union = length (a) + length (b) - intersection
    return (intersection/union)
}

#find Jaccard Similarity between the two sets 
jaccard(a, b)

0.4

İki liste arasındaki Jaccard benzerliği 0,4’tür .

İki küme hiçbir değeri paylaşmıyorsa işlevin 0 döndüreceğini unutmayın:

 c <- c(0, 1, 2, 3, 4, 5)
d <- c(6, 7, 8, 9, 10)

jaccard(c, d)

[1] 0

Ve eğer iki küme aynıysa fonksiyon 1 değerini döndürecektir:

 e <- c(0, 1, 2, 3, 4, 5)
f <- c(0, 1, 2, 3, 4, 5)

jaccard(e, f)

[1] 1

İşlev aynı zamanda dizeleri içeren kümeler için de çalışır:

 g <- c(' cat ', ' dog ', ' hippo ', ' monkey ')
h <- c(' monkey ', ' rhino ', ' ostrich ', ' salmon ')

jaccard(g, h)

0.142857

Bu fonksiyonu iki set arasındaki farklılık olan ve 1 – Jaccard Benzerliği olarak hesaplanan iki set arasındaki Jaccard mesafesini bulmak için de kullanabilirsiniz.

 a <- c(0, 1, 2, 5, 6, 8, 9)
b <- c(0, 2, 3, 4, 5, 7, 9)

#find Jaccard distance between sets a and b
1 - jaccard(a, b)

[1] 0.6

Jaccard Benzerlik Endeksi hakkında daha fazla bilgi edinmek için bu Wikipedia sayfasına bakın.

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek: R’deki Jaccard benzerliği

yazar hakkında

Dr.benjamin anderson

Yorum ekle