Como calcular decis em r (com exemplos)


Nas estatísticas, decis são números que dividem um conjunto de dados em dez grupos de igual frequência.

O primeiro decil é o ponto onde 10% de todos os valores dos dados ficam abaixo. O segundo decil é o ponto onde 20% de todos os valores dos dados ficam abaixo, e assim por diante.

Podemos usar a seguinte sintaxe para calcular decis de um conjunto de dados em R:

 quantile(data, probs = seq (.1, .9, by = .1 ))

O exemplo a seguir mostra como usar esta função na prática.

Exemplo: calcular decis em R

O código a seguir mostra como criar um conjunto de dados falso com 20 valores e depois calcular os valores decil do conjunto de dados:

 #create dataset
data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
          89, 90, 91, 92, 93, 93, 94, 95, 97, 99)

#calculate deciles of dataset
quantile(data, probs = seq (.1, .9, by = .1 ))

 10% 20% 30% 40% 50% 60% 70% 80% 90% 
63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2 

A maneira de interpretar decis é a seguinte:

  • 10% de todos os valores de dados são inferiores a 63,4
  • 20% de todos os valores de dados são inferiores a 67,8 .
  • 30% de todos os valores de dados são inferiores a 76,5 .
  • 40% de todos os valores de dados são inferiores a 83,6 .
  • 50% de todos os valores de dados são inferiores a 88,5 .
  • 60% de todos os valores de dados são inferiores a 90,4 .
  • 70% de todos os valores de dados são inferiores a 92,3 .
  • 80% de todos os valores de dados são inferiores a 93,2 .
  • 90% de todos os valores de dados são inferiores a 95,2 .

Deve-se notar que o valor no percentil 50 é igual ao valor mediano do conjunto de dados.

Exemplo: colocar valores em decis em R

Para colocar cada valor de dados em um decil, podemos usar a função ntile(x, ngroups) do pacote dplyr em R.

Veja como usar esta função para o conjunto de dados que criamos no exemplo anterior:

 library (dplyr)

#create dataset
data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                            89, 90, 91, 92, 93, 93, 94, 95, 97, 99))

#place each value into a decile
data$decile <- ntile(data, 10)

#viewdata
data

   values decile
1 56 1
2 58 1
3 64 2
4 67 2
5 68 3
6 73 3
7 78 4
8 83 4
9 84 5
10 88 5
11 89 6
12 90 6
13 91 7
14 92 7
15 93 8
16 93 8
17 94 9
18 95 9
19 97 10
20 99 10

A forma de interpretar o resultado é a seguinte:

  • O valor dos dados 56 está entre o percentil 0% e 10%, portanto está no primeiro decil.
  • O valor dos dados 58 está entre o percentil 0% e 10%, portanto está no primeiro decil.
  • O valor dos dados 64 está entre o percentil 10% e 20%, portanto está no segundo decil.
  • O valor dos dados 67 está entre o percentil 10% e 20%, portanto está no segundo decil.
  • O valor dos dados 68 está entre o percentil 20% e 30%, portanto está no terceiro decil.

E assim por diante.

Recursos adicionais

Como calcular percentis em R
Como calcular quartis em R
Como criar tabelas de frequência em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *