Como calcular o intervalo interquartil em r (com exemplos)


O intervalo interquartil representa a diferença entre o primeiro quartil (percentil 25) e o terceiro quartil (percentil 75) de um conjunto de dados.

Em termos simples, mede o desvio entre os 50% intermediários dos valores.

AIQ = Q3 – Q1

Podemos usar a função integrada IQR() para calcular o intervalo interquartil de um conjunto de valores em R:

 IQR(x)

Os exemplos a seguir mostram como usar esta função na prática.

Exemplo 1: intervalo interquartil de um vetor

O código a seguir mostra como calcular o intervalo interquartil de valores em um vetor:

 #definevector
x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x)

[1] 14.5

Exemplo 2: Intervalo Interquartil de um Vetor com Valores Omissos

Se o seu vetor tiver valores ausentes, certifique-se de especificar na.rm=TRUE para ignorar os valores ausentes ao calcular o intervalo interquartil:

 #define vector with some missing values
x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x, na. rm = TRUE )

[1] 10.25

Exemplo 3: intervalo interquartil de coluna em um quadro de dados

O código a seguir mostra como calcular o intervalo interquartil para uma coluna específica em um quadro de dados:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1' column
IQR(df$var1)

[1] 1

Exemplo 4: intervalo interquartil de múltiplas colunas em um quadro de dados

O código a seguir mostra como calcular o intervalo interquartil de múltiplas colunas em um quadro de dados:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1', 'var2', and 'var4' columns
sapply(df[, c(' var1 ', ' var2 ', ' var4 ')], IQR)

var1 var2 var4 
   1 4 7

Recursos adicionais

Como encontrar o intervalo em R
Como calcular o desvio padrão em R
Como interpretar o intervalo interquartil
Intervalo interquartil e desvio padrão: qual a diferença?

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *