Jak obliczyć odległość euklidesową w pythonie (z przykładami)
Odległość euklidesową między dwoma wektorami A i B oblicza się w następujący sposób:
Odległość euklidesowa = √ Σ(A i -B i ) 2
Aby obliczyć odległość euklidesową między dwoma wektorami w Pythonie, możemy użyć funkcji numpy.linalg.norm :
#import functions import numpy as np from numpy. linalg import norm #define two vectors a = np.array([2, 6, 7, 7, 5, 13, 14, 17, 11, 8]) b = np.array([3, 5, 5, 3, 7, 12, 13, 19, 22, 7]) #calculate Euclidean distance between the two vectors norm(ab) 12.409673645990857
Okazuje się, że odległość euklidesowa między dwoma wektorami wynosi 12,40967 .
Należy pamiętać, że ta funkcja wyświetli komunikat ostrzegawczy, jeśli dwa wektory nie będą tej samej długości:
#import functions import numpy as np from numpy. linalg import norm #define two vectors a = np.array([2, 6, 7, 7, 5, 13, 14]) b = np.array([3, 5, 5, 3, 7, 12, 13, 19, 22, 7]) #calculate Euclidean distance between the two vectors norm(ab) ValueError : operands could not be broadcast together with shapes (7,) (10,)
Zauważ, że możemy również użyć tej funkcji do obliczenia odległości euklidesowej między dwiema kolumnami ramki DataFrame pandy:
#import functions import pandas as pd import numpy as np from numpy. linalg import norm #define DataFrame with three columns df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate Euclidean distance between 'points' and 'assists' norm(df[' points '] - df[' assists ']) 40.496913462633174
Okazuje się, że odległość euklidesowa między dwiema kolumnami wynosi 40,49691 .
Uwagi
1. Istnieje kilka sposobów obliczania odległości euklidesowej w Pythonie, ale jak wyjaśnia ten wątek Stack Overflow , metoda opisana tutaj okazuje się najszybsza.
2. Pełną dokumentację funkcji numpy.linalg.norm znajdziesz tutaj .
3. Możesz odwołać się do tej strony Wikipedii, aby dowiedzieć się więcej o odległości euklidesowej.