Como calcular o desvio padrão em r (com exemplos)


Você pode usar a seguinte sintaxe para calcular o desvio padrão de um vetor em R:

 sd(x)

Observe que esta fórmula calcula o desvio padrão da amostra usando a seguinte fórmula:

Σ ( xi – μ) 2 / (n-1)

Ouro:

  • Σ : Um símbolo sofisticado que significa “soma”
  • x i : o i- ésimo valor do conjunto de dados
  • μ : O valor médio do conjunto de dados
  • n: O tamanho da amostra

Os exemplos a seguir mostram como usar esta função na prática.

Exemplo 1: Calcule o desvio padrão do vetor

O código a seguir mostra como calcular o desvio padrão de um único vetor em R:

 #create dataset
data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23)

#find standard deviation
sd(data)

[1] 8.279157

Observe que você deve usar na.rm = TRUE para calcular o desvio padrão se houver valores ausentes no conjunto de dados:

 #create dataset with missing values
data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23)

#attempt to find standard deviation
sd(data)

[1] NA

#find standard deviation and specify to ignore missing values
sd(data, na. rm = TRUE )

[1] 9.179753

Exemplo 2: Calcule o desvio padrão de uma coluna em um quadro de dados

O código a seguir mostra como calcular o desvio padrão de uma única coluna em um quadro de dados:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of column a
sd(data$a)

[1] 3.060501

Exemplo 3: Calcule o desvio padrão de múltiplas colunas em um quadro de dados

O código a seguir mostra como calcular o desvio padrão de múltiplas colunas em um quadro de dados:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of specific columns in data frame
apply(data[, c(' a ', ' c ', ' d ')], 2, sd)

       acd
3.060501 4.289522 9.544632

Recursos adicionais

Como encontrar o intervalo em R
Como calcular a variância amostral e populacional em R
Como remover outliers em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *