Média amostral versus média populacional: qual a diferença?


Muitas vezes, nas estatísticas, queremos responder a perguntas como:

  • Qual é a renda familiar média em uma determinada cidade?
  • Qual é o peso médio de uma determinada espécie de tartaruga?
  • Qual é a frequência média em jogos de futebol universitário?

Em cada cenário, queremos responder a uma pergunta sobre uma população , que representa todos os possíveis elementos individuais que queremos medir.

No entanto, em vez de recolher dados sobre cada indivíduo numa população, recolhemos dados sobre uma amostra da população, que representa uma parte da população total.

Por exemplo, podemos querer saber o peso médio de uma determinada espécie de tartaruga que tem uma população total de 800 tartarugas.

Como demoraria muito tempo para localizar e pesar todas as tartarugas da população, em vez disso coletamos uma amostra aleatória simples de 30 tartarugas e medimos seu peso:

Exemplo de exemplo médio

Poderíamos então utilizar o peso médio desta amostra de tartarugas para estimar o peso médio de todas as tartarugas da população.

Como calcular a média amostral

A fórmula para calcular a média amostral, frequentemente denotada por x , é a seguinte:

x = Σx i /n

Ouro:

  • Σ: Um símbolo grego sofisticado que significa “soma”
  • x i : O valor da i-ésima observação no conjunto de dados
  • n: O tamanho da amostra

Por exemplo, suponha que coletamos uma amostra de 10 tartarugas com os seguintes pesos (em libras):

  • 70, 80, 80, 85, 90, 95, 110, 120, 140, 150

A média amostral seria calculada da seguinte forma:

  • x = (70+ 80+80+85+90+95+110+120+140+150) / 10 = 102

Por que a média amostral é imparcial

No jargão estatístico, diríamos que a média amostral é uma estatística , enquanto a média populacional é um parâmetro .

Aqui está a diferença entre os dois termos:

Uma estatística é um número que descreve certas características de uma amostra.

Um parâmetro é um número que descreve uma característica de uma população.

O parâmetro é o valor que realmente queremos medir, mas a estatística é o valor que usamos para estimar o valor do parâmetro, pois a estatística é muito mais fácil de obter.

Quando usamos um método como a amostragem aleatória simples para obter uma amostra, dizemos que a média amostral é um estimador imparcial da média populacional.

Por outras palavras, não temos razões para acreditar que a média da amostra subestimaria ou sobrestimaria a verdadeira média da população.

A razão é que quando usamos um método como a amostragem aleatória simples, cada membro da população tem chances iguais de ser incluído na amostra, o que significa que a amostra provavelmente será uma “miniversão” da população geral. .

Diríamos que a amostra é representativa da população geral , o que significa que a média amostral deve ser uma boa estimativa da média populacional, assumindo que o tamanho da amostra seja suficientemente grande.

Sobre o uso de intervalos de confiança com a média amostral

Embora a média amostral forneça uma estimativa imparcial da média populacional, é improvável que corresponda exatamente à média populacional.

Por exemplo, se quisermos utilizar uma amostra de tartarugas para estimar o peso médio de uma população de tartarugas, podemos escolher uma amostra preenchida com tartarugas de baixo peso ou talvez uma amostra preenchida com tartarugas pesadas.

Para capturar esta incerteza em torno da nossa estimativa da média populacional, podemos criar um intervalo de confiança .

Um intervalo de confiança é um intervalo de valores que provavelmente contém um parâmetro populacional com um certo nível de confiança.

Por exemplo, podemos coletar uma amostra de 30 tartarugas e descobrir que o peso médio dessa amostra é de 102 libras. Se construirmos então um intervalo de confiança de 95%, poderemos descobrir que o intervalo é:

Intervalo de confiança de 95% = [98,5, 105,5]

Interpretaríamos isto como significando que há 95% de probabilidade de que o intervalo de confiança de [98,5, 105,5] contenha o verdadeiro peso médio da população de tartarugas.

Este intervalo de confiança é mais útil do que a média amostral simples, porque nos dá um intervalo de valores dentro dos quais provavelmente se situará a verdadeira média populacional.

Recursos adicionais

População vs. amostra: qual é a diferença?
Estatísticas vs. parâmetros: qual é a diferença?
Uma introdução aos intervalos de confiança

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *