Comment calculer la distance de Manhattan en R (avec exemples)



La distance de Manhattan entre deux vecteurs, A et B , est calculée comme suit :

Σ|une je – b je |

i est le i ème élément de chaque vecteur.

Cette distance est utilisée pour mesurer la dissemblance entre deux vecteurs quelconques et est couramment utilisée dans de nombreux algorithmes d’apprentissage automatique différents.

Ce didacticiel fournit quelques exemples de calcul de la distance de Manhattan dans R.

Exemple 1 : Distance de Manhattan entre deux vecteurs

Le code suivant montre comment créer une fonction personnalisée pour calculer la distance de Manhattan entre deux vecteurs dans R :

#create function to calculate Manhattan distance
manhattan_dist <- function(a, b){
     dist <- abs(a-b)
     dist <- sum(dist)
     return(dist)
}

#define two vectors
a <- c(2, 4, 4, 6)

b <- c(5, 5, 7, 8)

#calculate Manhattan distance between vectors
manhattan_dist(a, b)

[1] 9

La distance de Manhattan entre ces deux vecteurs s’avère être de 9 .

Nous pouvons confirmer que cela est correct en calculant rapidement à la main la distance de Manhattan :

Σ|une je – b je | = |2-5| + |4-5| + |4-7| + |6-8| = 3 + 1 + 3 + 2 = 9 .

Exemple 2 : Distance de Manhattan entre les vecteurs dans une matrice

Pour calculer la distance de Manhattan entre plusieurs vecteurs dans une matrice, nous pouvons utiliser la fonction dist() intégrée dans R :

#create four vectors
a <- c(2, 4, 4, 6)

b <- c(5, 5, 7, 8)

c <- c(9, 9, 9, 8)

d <- c(1, 2, 3, 3)

#bind vectors into one matrix
mat <- rbind(a, b, c, d)

#calculate Manhattan distance between each vector in the matrix
dist(mat, method = "manhattan")

   a  b  c
b  9      
c 19 10   
d  7 16 26

La façon d’interpréter cette sortie est la suivante :

  • La distance de Manhattan entre les vecteurs a et b est de 9 .
  • La distance de Manhattan entre les vecteurs a et c est de 19 .
  • La distance de Manhattan entre les vecteurs a et d est de 7 .
  • La distance de Manhattan entre les vecteurs b et c est de 10 .
  • La distance de Manhattan entre les vecteurs b et d est de 16 .
  • La distance de Manhattan entre les vecteurs c et d est de 26 .

Notez que chaque vecteur de la matrice doit avoir la même longueur.

Ressources additionnelles

Comment calculer la distance euclidienne dans R
Comment calculer la distance de Mahalanobis en R
Comment calculer la distance de Minkowski en R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *