Como calcular a distância euclidiana em r (com exemplos)
A distância euclidiana entre dois vetores A e B é calculada da seguinte forma:
Distância euclidiana = √ Σ(A i -B i ) 2
Para calcular a distância euclidiana entre dois vetores em R, podemos definir a seguinte função:
euclidean <- function (a, b) sqrt ( sum ((a - b)^2))
Podemos então usar esta função para encontrar a distância euclidiana entre quaisquer dois vetores:
#define two vectors a <- c(2, 6, 7, 7, 5, 13, 14, 17, 11, 8) b <- c(3, 5, 5, 3, 7, 12, 13, 19, 22, 7) #calculate Euclidean distance between vectors euclid(a, b) [1] 12.40967
A distância euclidiana entre os dois vetores é 12,40967 .
Observe que também podemos usar esta função para calcular a distância euclidiana entre duas colunas de um quadro de dados:
#define data frame df <- data.frame(a=c(3, 4, 4, 6, 7, 14, 15), b=c(4, 8, 8, 9, 14, 13, 7), c=c(7, 7, 8, 5, 15, 11, 8), d=c(9, 6, 6, 7, 6, 15, 19)) #calculate Euclidean distance between columns a and d euclid(df$a, df$d) [1] 7.937254
Observe que esta função produzirá uma mensagem de aviso se os dois vetores não tiverem o mesmo comprimento:
#define two vectors of unequal length a <- c(2, 6, 7, 7, 5, 13, 14) b <- c(3, 5, 5, 3, 7, 12, 13, 19, 22, 7) #attempt to calculate Euclidean distance between vectors euclid(a, b) [1] 23.93742 Warning message: In a - b: longer object length is not a multiple of shorter object length
Você pode consultar esta página da Wikipedia para saber mais sobre a distância euclidiana.
Recursos adicionais
Como calcular a distância de Manhattan em R
Como calcular a distância de Minkowski em R
Como calcular a distância de Hamming em R
Como calcular a distância de Mahalanobis em R
Como calcular a distância de Levenshtein em R