Como comparar strings em r (3 exemplos)


Você pode usar os seguintes métodos para comparar strings em R:

Método 1: compare duas strings

 #case-sensitive comparison
string1 == string2

#case-insensitive comparison
tolower (string1) == tolower (string2)

Método 2: compare dois vetores de string

 #case-sensitive comparison
identical(vector1, vector2)

#case-insensitive comparison
identical( tolower (vector1), tolower (vector2))

Método 3: Encontre semelhanças entre dois vetores de string

 #find which strings in vector1 are also in vector2
vector1[vector1 %in% vector2]  

Os exemplos a seguir mostram como usar cada método na prática.

Exemplo 1: Verifique se dois vetores são iguais

O código a seguir mostra como comparar duas strings em R para determinar se elas são iguais:

 #define two strings
string1 <- "Mavericks"
string2 <- "mavericks"

#case-sensitive comparison
string1 == string2

[1] FALSE

#case-insensitive comparison
tolower (string1) == tolower (string2)

[1] TRUE

A comparação que diferencia maiúsculas de minúsculas retorna FALSE , pois as duas strings não são exatamente idênticas.

No entanto, a comparação que não diferencia maiúsculas de minúsculas retorna TRUE , pois ambas as strings contêm os mesmos caracteres na mesma ordem, independentemente da caixa.

Exemplo 2: Compare dois vetores de string

O código a seguir mostra como usar a função idêntica() para determinar se dois vetores de string são iguais:

 #define two vectors of strings
vector1 <- c("hey", "hello", "HI")
vector2 <- c("hey", "hello", "hi")

#case-sensitive comparison
identical(vector1, vector2)

[1] FALSE

#case-insensitive comparison
identical( tolower (vector1), tolower (vector2))

[1] TRUE

A comparação que diferencia maiúsculas de minúsculas retorna um valor FALSE , pois os dois vetores não contêm exatamente as mesmas strings no mesmo caso.

No entanto, a comparação que não diferencia maiúsculas de minúsculas retorna TRUE , pois ambos os vetores contêm as mesmas strings, independentemente da caixa.

Exemplo 3: Encontrando semelhanças entre dois vetores de string

O código a seguir mostra como usar o operador %in% para descobrir quais strings em um vetor pertencem a outro vetor:

 #define two vectors of strings
vector1 <- c("hey", "hello", "greetings")
vector2 <- c("hey", "hello", "hi")

#find which strings in vector1 are also in vector2
vector1[vector1 %in% vector2]

[1] “hey” “hello”

A partir do resultado, podemos ver que as strings “hey” e “hello” existem tanto no vetor1 quanto no vetor2.

Relacionado: Como usar o operador% in% em R

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em R:

Como comparar duas colunas em R
Como comparar dois vetores em R
Como encontrar a localização dos caracteres em uma string em R
Como converter vetor em string em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *