Como calcular o erro padrão da média em r


O erro padrão da média é uma forma de medir a distribuição de valores em um conjunto de dados. É calculado da seguinte forma:

Erro padrão = s / √n

Ouro:

  • s : desvio padrão da amostra
  • n : tamanho da amostra

Este tutorial explica dois métodos que você pode usar para calcular o erro padrão de um conjunto de dados em R.

Método 1: use a biblioteca Plottrix

A primeira maneira de calcular o erro padrão da média é usar a função std.error() integrada da biblioteca Plotrix.

O código a seguir mostra como usar esta função:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

O erro padrão da média é 2,001447 .

Método 2: Defina sua própria função

Outra forma de calcular o erro padrão da média de um conjunto de dados é simplesmente definir sua própria função.

O código a seguir mostra como fazer isso:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Novamente, o erro padrão da média é 2,0014 .

Como interpretar o erro padrão da média

O erro padrão da média é simplesmente uma medida da dispersão dos valores em torno da média.

Há duas coisas a se ter em mente ao interpretar o erro padrão da média:

1. Quanto maior o erro padrão da média, mais dispersos estão os valores em torno da média em um conjunto de dados.

Para ilustrar isso, considere se alterarmos o último valor do conjunto de dados anterior por um número muito maior:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Observe como o erro padrão aumenta de 2,001447 para 6,978265 .

Isso indica que os valores neste conjunto de dados estão mais distribuídos em torno da média em comparação com o conjunto de dados anterior.

2. À medida que o tamanho da amostra aumenta, o erro padrão da média tende a diminuir.

Para ilustrar isso, considere o erro padrão da média para os dois conjuntos de dados a seguir:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

O segundo conjunto de dados é simplesmente o primeiro conjunto de dados repetido duas vezes.

Portanto, ambos os conjuntos de dados têm a mesma média, mas o segundo conjunto de dados tem um tamanho de amostra maior e, portanto, tem um erro padrão menor.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como calcular a variância amostral e populacional em R
Como calcular a variância agrupada em R
Como calcular o coeficiente de variação de R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *