Comment calculer la distance de Manhattan en Python (avec exemples)
La distance de Manhattan entre deux vecteurs, A et B , est calculée comme suit :
Σ|UNE je – B je |
où i est le i ème élément de chaque vecteur.
Cette distance est utilisée pour mesurer la dissemblance entre deux vecteurs et est couramment utilisée dans de nombreux algorithmes d’apprentissage automatique .
Ce didacticiel montre deux façons de calculer la distance de Manhattan entre deux vecteurs en Python.
Méthode 1 : écrire une fonction personnalisée
Le code suivant montre comment créer une fonction personnalisée pour calculer la distance de Manhattan entre deux vecteurs en Python :
from math import sqrt #create function to calculate Manhattan distance def manhattan(a, b): return sum(abs(val1-val2) for val1, val2 in zip(a,b)) #define vectors A = [2, 4, 4, 6] B = [5, 5, 7, 8] #calculate Manhattan distance between vectors manhattan(A, B) 9
La distance de Manhattan entre ces deux vecteurs s’avère être de 9 .
Nous pouvons confirmer que cela est correct en calculant rapidement à la main la distance de Manhattan :
Σ|UNE je – B je | = |2-5| + |4-5| + |4-7| + |6-8| = 3 + 1 + 3 + 2 = 9 .
Méthode 2 : utiliser la fonction cityblock()
Une autre façon de calculer la distance de Manhattan entre deux vecteurs consiste à utiliser la fonction cityblock() du package SciPy :
from scipy.spatial.distance import cityblock #define vectors A = [2, 4, 4, 6] B = [5, 5, 7, 8] #calculate Manhattan distance between vectors cityblock(A, B) 9
Une fois de plus, la distance de Manhattan entre ces deux vecteurs s’avère être de 9 .
Notez que nous pouvons également utiliser cette fonction pour trouver la distance Manhattan entre deux colonnes dans un DataFrame pandas :
from scipy.spatial.distance import cityblock import pandas as pd #define DataFrame df = pd.DataFrame({'A': [2, 4, 4, 6], 'B': [5, 5, 7, 8], 'C': [9, 12, 12, 13]}) #calculate Manhattan distance between columns A and B cityblock(df.A, df.B) 9
Ressources additionnelles
Comment calculer la distance euclidienne en Python
Comment calculer la distance de Hamming en Python
Comment calculer la distance de Levenshtein en Python
Comment calculer la distance de Mahalanobis en Python