Como calcular o erro padrão da média em python
O erro padrão da média é uma forma de medir a distribuição de valores em um conjunto de dados. É calculado da seguinte forma:
Erro padrão da média = s / √n
Ouro:
- s : desvio padrão da amostra
- n : tamanho da amostra
Este tutorial explica dois métodos que você pode usar para calcular o erro padrão da média de um conjunto de dados em Python. Observe que ambos os métodos produzem exatamente os mesmos resultados.
Método 1: use SciPy
A primeira maneira de calcular o erro padrão da média é usar a função sem() da biblioteca SciPy Stats.
O código a seguir mostra como usar esta função:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29] #calculate standard error of the mean sem(data) 2.001447
O erro padrão da média é 2,001447 .
Método 2: usar NumPy
Outra maneira de calcular o erro padrão da média de um conjunto de dados é usar a função std() do NumPy.
Observe que precisamos especificar ddof=1 no argumento desta função para calcular o desvio padrão da amostra em oposição ao desvio padrão da população.
O código a seguir mostra como fazer isso:
import numpy as np #define dataset data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]) #calculate standard error of the mean n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data)) 2.001447
Novamente, o erro padrão da média é 2,001447 .
Como interpretar o erro padrão da média
O erro padrão da média é simplesmente uma medida da dispersão dos valores em torno da média. Há duas coisas a se ter em mente ao interpretar o erro padrão da média:
1. Quanto maior o erro padrão da média, mais dispersos estão os valores em torno da média em um conjunto de dados.
Para ilustrar isso, considere se alterarmos o último valor do conjunto de dados anterior por um número muito maior:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ] #calculate standard error of the mean sem(data) 6.978265
Observe como o erro padrão aumenta de 2,001447 para 6,978265 . Isso indica que os valores neste conjunto de dados estão mais distribuídos em torno da média em comparação com o conjunto de dados anterior.
2. À medida que o tamanho da amostra aumenta, o erro padrão da média tende a diminuir.
Para ilustrar isso, considere o erro padrão da média para os dois conjuntos de dados a seguir:
from scipy . stats import week #define first dataset and find SEM data1 = [1, 2, 3, 4, 5] sem(data1) 0.7071068 #define second dataset and find SEM data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] sem(data2) 0.4714045
O segundo conjunto de dados é simplesmente o primeiro conjunto de dados repetido duas vezes. Portanto, ambos os conjuntos de dados têm a mesma média, mas o segundo conjunto de dados tem um tamanho de amostra maior e, portanto, tem um erro padrão menor.
Recursos adicionais
Como calcular o erro padrão da média em R
Como calcular o erro padrão da média no Excel
Como calcular o erro padrão da média no Planilhas Google