Come calcolare i decili in r (con esempi)


In statistica, i decili sono numeri che dividono un set di dati in dieci gruppi di uguale frequenza.

Il primo decile è il punto in cui cade il 10% di tutti i valori dei dati. Il secondo decile è il punto in cui il 20% di tutti i valori dei dati scende al di sotto e così via.

Possiamo usare la seguente sintassi per calcolare i decili di un set di dati in R:

 quantile(data, probs = seq (.1, .9, by = .1 ))

L’esempio seguente mostra come utilizzare questa funzione nella pratica.

Esempio: calcolare i decili in R

Il codice seguente mostra come creare un set di dati falso con 20 valori e quindi calcolare i valori decili del set di dati:

 #create dataset
data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
          89, 90, 91, 92, 93, 93, 94, 95, 97, 99)

#calculate deciles of dataset
quantile(data, probs = seq (.1, .9, by = .1 ))

 10% 20% 30% 40% 50% 60% 70% 80% 90% 
63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2 

Il modo di interpretare i decili è il seguente:

  • Il 10% di tutti i valori dei dati sono inferiori a 63,4
  • Il 20% di tutti i valori dei dati sono inferiori a 67,8 .
  • Il 30% di tutti i valori dei dati sono inferiori a 76,5 .
  • Il 40% di tutti i valori dei dati sono inferiori a 83,6 .
  • Il 50% di tutti i valori dei dati sono inferiori a 88,5 .
  • Il 60% di tutti i valori dei dati sono inferiori a 90,4 .
  • Il 70% di tutti i valori dei dati sono inferiori a 92,3 .
  • L’80% di tutti i valori dei dati sono inferiori a 93,2 .
  • Il 90% di tutti i valori dei dati sono inferiori a 95,2 .

Va notato che il valore al 50° percentile è pari al valore mediano del set di dati.

Esempio: inserimento dei valori in decili in R

Per posizionare ciascun valore di dati in un decile, possiamo utilizzare la funzione ntile(x, ngroups) dal pacchetto dplyr in R.

Ecco come utilizzare questa funzione per il set di dati creato nell’esempio precedente:

 library (dplyr)

#create dataset
data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                            89, 90, 91, 92, 93, 93, 94, 95, 97, 99))

#place each value into a decile
data$decile <- ntile(data, 10)

#viewdata
data

   values decile
1 56 1
2 58 1
3 64 2
4 67 2
5 68 3
6 73 3
7 78 4
8 83 4
9 84 5
10 88 5
11 89 6
12 90 6
13 91 7
14 92 7
15 93 8
16 93 8
17 94 9
18 95 9
19 97 10
20 99 10

Il modo di interpretare il risultato è il seguente:

  • Il valore dei dati 56 è compreso tra lo 0% e il 10% del percentile, quindi è nel primo decile.
  • Il valore dei dati 58 è compreso tra lo 0% e il 10% del percentile, quindi è nel primo decile.
  • Il valore dei dati 64 è compreso tra il 10% e il 20% del percentile, quindi è nel secondo decile.
  • Il valore dei dati 67 è compreso tra il 10% e il 20% del percentile, quindi è nel secondo decile.
  • Il valore dei dati 68 è compreso tra il 20% e il 30% percentile, quindi è nel terzo decile.

E così via.

Risorse addizionali

Come calcolare i percentili in R
Come calcolare i quartili in R
Come creare tabelle di frequenza in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *