Como calcular o erro padrão da média em r
O erro padrão da média é uma forma de medir a distribuição de valores em um conjunto de dados. É calculado da seguinte forma:
Erro padrão = s / √n
Ouro:
- s : desvio padrão da amostra
- n : tamanho da amostra
Este tutorial explica dois métodos que você pode usar para calcular o erro padrão de um conjunto de dados em R.
Método 1: use a biblioteca Plottrix
A primeira maneira de calcular o erro padrão da média é usar a função std.error() integrada da biblioteca Plotrix.
O código a seguir mostra como usar esta função:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
O erro padrão da média é 2,001447 .
Método 2: Defina sua própria função
Outra forma de calcular o erro padrão da média de um conjunto de dados é simplesmente definir sua própria função.
O código a seguir mostra como fazer isso:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Novamente, o erro padrão da média é 2,0014 .
Como interpretar o erro padrão da média
O erro padrão da média é simplesmente uma medida da dispersão dos valores em torno da média.
Há duas coisas a se ter em mente ao interpretar o erro padrão da média:
1. Quanto maior o erro padrão da média, mais dispersos estão os valores em torno da média em um conjunto de dados.
Para ilustrar isso, considere se alterarmos o último valor do conjunto de dados anterior por um número muito maior:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Observe como o erro padrão aumenta de 2,001447 para 6,978265 .
Isso indica que os valores neste conjunto de dados estão mais distribuídos em torno da média em comparação com o conjunto de dados anterior.
2. À medida que o tamanho da amostra aumenta, o erro padrão da média tende a diminuir.
Para ilustrar isso, considere o erro padrão da média para os dois conjuntos de dados a seguir:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
O segundo conjunto de dados é simplesmente o primeiro conjunto de dados repetido duas vezes.
Portanto, ambos os conjuntos de dados têm a mesma média, mas o segundo conjunto de dados tem um tamanho de amostra maior e, portanto, tem um erro padrão menor.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como calcular a variância amostral e populacional em R
Como calcular a variância agrupada em R
Como calcular o coeficiente de variação de R