Comment calculer la distance de Hamming dans Excel
La distance de Hamming entre deux vecteurs est simplement la somme des éléments correspondants qui diffèrent entre les vecteurs.
Par exemple, supposons que nous ayons les deux vecteurs suivants :
x = [1, 2, 3, 4] y = [1, 2, 5, 7]
La distance de Hamming entre les deux vecteurs serait 2 , puisqu’il s’agit du nombre total d’éléments correspondants qui ont des valeurs différentes.
Pour calculer la distance de Hamming entre deux colonnes dans Excel, on peut utiliser la syntaxe suivante :
=COUNT(RANGE1)-SUMPRODUCT(--(RANGE1 = RANGE2))
Voici en résumé ce que fait la formule :
- COUNT trouve le nombre total d’observations dans la première colonne.
- RANGE1 = RANGE2 compare chaque observation par paire entre les colonnes et renvoie un VRAI ou un FAUX.
- – – convertit les valeurs VRAI et FAUX en 0 et 1.
- SUMPRODUCT trouve la somme de tous les 1.
Ce didacticiel fournit plusieurs exemples d’utilisation pratique de ce calcul.
Exemple 1 : Distance de Hamming entre les vecteurs binaires
Le code suivant montre comment calculer la distance de Hamming entre deux colonnes dans Excel contenant chacune seulement deux valeurs possibles :
La distance de Hamming entre les deux colonnes est de 3 .
Exemple 2 : Distance de Hamming entre des vecteurs numériques
Le code suivant montre comment calculer la distance de Hamming entre deux colonnes dans Excel contenant chacune plusieurs valeurs numériques :
La distance de Hamming entre les deux vecteurs est de 7 .
Ressources additionnelles
Comment calculer l’écart absolu moyen dans Excel
Comment normaliser les données dans Excel
Comment trouver les valeurs aberrantes dans Excel