População vs. amostra: qual é a diferença?
Muitas vezes, em estatística, queremos recolher dados para que possamos responder a certas questões de investigação.
Por exemplo, podemos querer responder às seguintes perguntas:
1. Qual é a renda familiar média em Miami, Flórida?
2. Qual é o peso médio de uma determinada população de tartarugas?
3. Qual a percentagem de residentes num determinado concelho que apoia uma determinada lei?
Em cada cenário, queremos responder a uma pergunta sobre uma população , que representa todos os possíveis elementos individuais que queremos medir.
No entanto, em vez de recolher dados sobre cada indivíduo de uma população, recolhemos dados sobre uma amostra da população, que representa uma parte da população.
População : Cada item individual possível que queremos medir.
Amostra: Uma parcela da população.
Aqui está um exemplo de população versus amostra nos três exemplos introdutórios.
Exemplo 1: Qual é a renda familiar média em Miami, Flórida?
A população total pode consistir em 500.000 agregados familiares, mas só podemos recolher dados numa amostra de 2.000 agregados familiares no total.
2. Qual é o peso médio de uma determinada população de tartarugas?
A população total poderia incluir 800 tartarugas, mas só poderíamos recolher dados sobre uma amostra de 30 tartarugas.
3. Qual a percentagem de residentes num determinado concelho que apoia uma determinada lei?
A população total pode ser de 50.000, mas só podemos recolher dados sobre uma amostra de 1.000.
Por que usar amostras?
Existem vários motivos pelos quais geralmente coletamos dados em amostras e não em populações inteiras, incluindo:
1 . Demora demasiado tempo a recolher dados sobre uma população inteira . Por exemplo, se quisermos saber a renda familiar média em Miami, Flórida, pode levar meses ou até anos para coletar a renda de cada família. No momento em que coletamos todos esses dados, a população pode ter mudado ou a questão de pesquisa na qual estamos interessados pode não existir mais.
2. É demasiado caro recolher dados sobre uma população inteira. Muitas vezes é demasiado caro recolher dados para cada indivíduo numa população, por isso optamos por recolher dados numa amostra.
3. É impossível recolher dados sobre uma população inteira. Em muitos casos, simplesmente não é possível recolher dados para todos os indivíduos de uma população. Por exemplo, pode ser extremamente difícil encontrar e pesar todas as tartarugas de uma determinada população de interesse.
Ao coletar dados em amostras, conseguimos reunir informações sobre uma determinada população com muito mais rapidez e menor custo.
E se a nossa amostra for representativa da população , então podemos generalizar os resultados de uma amostra para uma população maior com um elevado nível de confiança.
A importância de amostras representativas
Quando coletamos uma amostra de uma população, idealmente queremos que a amostra se assemelhe a uma “miniversão” da nossa população.
Por exemplo, digamos que queremos entender as preferências cinematográficas dos alunos de um determinado distrito escolar com um total de 5.000 alunos. Dado que demoraria demasiado tempo a entrevistar cada aluno individualmente, poderíamos, em vez disso, recolher uma amostra de 100 alunos e perguntar-lhes sobre as suas preferências.
Se a população estudantil global for composta por 50% de raparigas e 50% de rapazes, a nossa amostra não seria representativa se incluísse 90% de rapazes e apenas 10% de raparigas.
Ou se a população geral for composta por partes iguais de calouros, alunos do segundo ano, juniores e veteranos, então nossa amostra não seria representativa se incluísse apenas calouros.
Uma amostra é representativa de uma população se as características dos indivíduos da amostra corresponderem de perto às características dos indivíduos da população geral.
Quando isso acontece, podemos generalizar com segurança os resultados da amostra para a população em geral.
Como obter amostras
Existem muitos métodos diferentes que podemos usar para obter amostras de populações.
Para maximizar a chance de obter uma amostra representativa, podemos usar um dos três métodos:
Amostragem aleatória simples: seleção aleatória de indivíduos usando um gerador de números aleatórios ou meios de seleção aleatória.
Amostragem aleatória sistemática: coloque cada membro de uma população em uma determinada ordem. Escolha um ponto de partida aleatório e selecione um membro de n para fazer parte da amostra.
Amostragem aleatória estratificada: divisão de uma população em grupos. Selecione aleatoriamente alguns membros de cada grupo para fazer parte da amostra.
Em cada um desses métodos, cada indivíduo da população tem igual probabilidade de ser incluído na amostra. Isto maximiza as chances de obter uma amostra que seja uma “mini versão” da população.