Come calcolare la deviazione standard in r (con esempi)


È possibile utilizzare la seguente sintassi per calcolare la deviazione standard di un vettore in R:

 sd(x)

Tieni presente che questa formula calcola la deviazione standard del campione utilizzando la seguente formula:

Σ (x i – μ) 2 / (n-1)

Oro:

  • Σ : un simbolo di fantasia che significa “somma”
  • x i : l’i -esimo valore del set di dati
  • μ : il valore medio del set di dati
  • n: la dimensione del campione

I seguenti esempi mostrano come utilizzare questa funzione nella pratica.

Esempio 1: calcolare la deviazione standard del vettore

Il codice seguente mostra come calcolare la deviazione standard di un singolo vettore in R:

 #create dataset
data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23)

#find standard deviation
sd(data)

[1] 8.279157

Tieni presente che devi utilizzare na.rm = TRUE per calcolare la deviazione standard se nel set di dati sono presenti valori mancanti:

 #create dataset with missing values
data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23)

#attempt to find standard deviation
sd(data)

[1] NA

#find standard deviation and specify to ignore missing values
sd(data, na. rm = TRUE )

[1] 9.179753

Esempio 2: calcolare la deviazione standard di una colonna in un frame di dati

Il codice seguente mostra come calcolare la deviazione standard di una singola colonna in un frame di dati:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of column a
sd(data$a)

[1] 3.060501

Esempio 3: calcolare la deviazione standard di più colonne in un frame di dati

Il codice seguente mostra come calcolare la deviazione standard di più colonne in un frame di dati:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of specific columns in data frame
apply(data[, c(' a ', ' c ', ' d ')], 2, sd)

       acd
3.060501 4.289522 9.544632

Risorse addizionali

Come trovare l’intervallo in R
Come calcolare la varianza del campione e della popolazione in R
Come rimuovere gli outlier in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *