Como calcular o erro padrão da média em python


O erro padrão da média é uma forma de medir a distribuição de valores em um conjunto de dados. É calculado da seguinte forma:

Erro padrão da média = s / √n

Ouro:

  • s : desvio padrão da amostra
  • n : tamanho da amostra

Este tutorial explica dois métodos que você pode usar para calcular o erro padrão da média de um conjunto de dados em Python. Observe que ambos os métodos produzem exatamente os mesmos resultados.

Método 1: use SciPy

A primeira maneira de calcular o erro padrão da média é usar a função sem() da biblioteca SciPy Stats.

O código a seguir mostra como usar esta função:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calculate standard error of the mean 
sem(data)

2.001447

O erro padrão da média é 2,001447 .

Método 2: usar NumPy

Outra maneira de calcular o erro padrão da média de um conjunto de dados é usar a função std() do NumPy.

Observe que precisamos especificar ddof=1 no argumento desta função para calcular o desvio padrão da amostra em oposição ao desvio padrão da população.

O código a seguir mostra como fazer isso:

 import numpy as np

#define dataset
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

#calculate standard error of the mean 
n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data))

2.001447

Novamente, o erro padrão da média é 2,001447 .

Como interpretar o erro padrão da média

O erro padrão da média é simplesmente uma medida da dispersão dos valores em torno da média. Há duas coisas a se ter em mente ao interpretar o erro padrão da média:

1. Quanto maior o erro padrão da média, mais dispersos estão os valores em torno da média em um conjunto de dados.

Para ilustrar isso, considere se alterarmos o último valor do conjunto de dados anterior por um número muito maior:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calculate standard error of the mean 
sem(data)

6.978265

Observe como o erro padrão aumenta de 2,001447 para 6,978265 . Isso indica que os valores neste conjunto de dados estão mais distribuídos em torno da média em comparação com o conjunto de dados anterior.

2. À medida que o tamanho da amostra aumenta, o erro padrão da média tende a diminuir.

Para ilustrar isso, considere o erro padrão da média para os dois conjuntos de dados a seguir:

 from scipy . stats import week 

#define first dataset and find SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

#define second dataset and find SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

O segundo conjunto de dados é simplesmente o primeiro conjunto de dados repetido duas vezes. Portanto, ambos os conjuntos de dados têm a mesma média, mas o segundo conjunto de dados tem um tamanho de amostra maior e, portanto, tem um erro padrão menor.

Recursos adicionais

Como calcular o erro padrão da média em R
Como calcular o erro padrão da média no Excel
Como calcular o erro padrão da média no Planilhas Google

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *