Come calcolare l'intervallo interquartile in r (con esempi)


L’ intervallo interquartile rappresenta la differenza tra il primo quartile (il 25° percentile) e il terzo quartile (il 75° percentile) di un set di dati.

In termini semplici, misura la deviazione tra il 50% medio dei valori.

IQR = Q3 – Q1

Possiamo utilizzare la funzione integrata IQR() per calcolare l’intervallo interquartile di un insieme di valori in R:

 IQR(x)

I seguenti esempi mostrano come utilizzare questa funzione nella pratica.

Esempio 1: intervallo interquartile di un vettore

Il codice seguente mostra come calcolare l’intervallo interquartile dei valori in un vettore:

 #definevector
x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x)

[1] 14.5

Esempio 2: intervallo interquartile di un vettore con valori mancanti

Se il tuo vettore ha valori mancanti, assicurati di specificare na.rm=TRUE per ignorare i valori mancanti durante il calcolo dell’intervallo interquartile:

 #define vector with some missing values
x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x, na. rm = TRUE )

[1] 10.25

Esempio 3: intervallo interquartile di colonna in un frame di dati

Il codice seguente mostra come calcolare l’intervallo interquartile per una colonna specifica in un frame di dati:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1' column
IQR(df$var1)

[1] 1

Esempio 4: intervallo interquartile di più colonne in un frame di dati

Il codice seguente mostra come calcolare l’intervallo interquartile di più colonne in un frame di dati:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1', 'var2', and 'var4' columns
sapply(df[, c(' var1 ', ' var2 ', ' var4 ')], IQR)

var1 var2 var4 
   1 4 7

Risorse addizionali

Come trovare l’intervallo in R
Come calcolare la deviazione standard in R
Come interpretare lo scarto interquartile
Intervallo interquartile e deviazione standard: qual è la differenza?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *