Distribuição de amostras
Este artigo explica o que é distribuição amostral em estatísticas e para que ela é usada. Assim você encontrará o significado de uma distribuição amostral, um exemplo concreto de distribuição amostral e, além disso, as fórmulas para os tipos mais comuns de distribuições amostrais.
Qual é a distribuição amostral?
A distribuição amostral , ou distribuição amostral , é a distribuição que resulta da consideração de todas as amostras possíveis de uma população. Em outras palavras, a distribuição amostral é a distribuição obtida calculando um parâmetro amostral de todas as amostras possíveis de uma população.
Por exemplo, se extrairmos todas as amostras possíveis de uma população estatística e calcularmos a média de cada amostra, o conjunto de médias amostrais forma uma distribuição amostral. Mais precisamente, como o parâmetro calculado é a média aritmética, é a distribuição amostral da média.
Nas estatísticas, a distribuição amostral é usada para calcular a probabilidade de aproximação do valor do parâmetro populacional ao estudar uma única amostra. Da mesma forma, a distribuição amostral nos permite estimar o erro amostral para um determinado tamanho de amostra.
Exemplo de distribuição de amostragem
Agora que conhecemos a definição de distribuição amostral, vejamos um exemplo simples para compreender totalmente o conceito.
- Numa caixa colocamos três bolas e cada uma tem um número escrito de um a três, de forma que uma bola tem o número 1, outra bola tem o número 2 e a última bola tem o número 3. Para uma amostra de tamanho n = 2, calcula as probabilidades da distribuição amostral da média se forem selecionadas amostras com reposição.
As amostras são selecionadas com reposição, ou seja, a bola recolhida para selecionar o primeiro elemento da amostra é devolvida à caixa e pode ser selecionada novamente na segunda extração. Portanto, todas as amostras possíveis da população são:
1,1 1,2 1,3
2,1 2,2 2,3
3,1 3,2 3,3
Assim, calculamos a média aritmética de cada amostra possível:
Portanto, as probabilidades de obter cada valor da média amostral ao selecionar uma amostra aleatória da população são as seguintes:
As probabilidades da distribuição amostral apresentadas na tabela acima foram calculadas dividindo o número de amostras com o referido valor médio pelo número total de casos possíveis. Por exemplo: a média amostral é 1,5 em dois casos entre nove possíveis, portanto P(1,5)=2/9.
Tipos de distribuições amostrais
As distribuições amostrais (ou distribuições amostrais) podem ser classificadas com base no parâmetro amostral a partir do qual foram obtidas. Portanto, os tipos mais comuns de distribuições são os seguintes:
- Distribuição amostral da média : É a distribuição amostral que resulta do cálculo da média aritmética de cada amostra.
- Distribuição Amostragem Proporcional : É a distribuição amostral obtida calculando a proporção de todas as amostras.
- Distribuição amostral de variância : Esta é a distribuição amostral que forma o conjunto de todas as variâncias na amostra.
- Distribuição amostral por diferença de médias : é a distribuição amostral que resulta do cálculo da diferença entre as médias de todas as amostras possíveis de duas populações diferentes.
- Distribuição amostral por diferença de proporções : é a distribuição amostral obtida subtraindo todas as proporções amostrais possíveis de duas populações.
Cada tipo de distribuição amostral é explicado com mais detalhes abaixo.
Distribuição amostral da média
Dada uma população que segue uma distribuição de probabilidade normal com média
e desvio padrão
e amostras de tamanho são extraídas
, a distribuição amostral da média também será definida por uma distribuição normal com as seguintes características:
Ouro
é a média da distribuição amostral da média e
é o seu desvio padrão. Além disso,
é o erro padrão da distribuição amostral.
Nota: Se a população não seguir uma distribuição normal, mas o tamanho da amostra for grande (n>30), a distribuição amostral da média também pode ser aproximada à distribuição normal acima pelo limite do teorema central.
Portanto, como a distribuição amostral da média segue uma distribuição normal, a fórmula para calcular qualquer probabilidade relacionada à média amostral é:
Ouro:
-
é a média amostral.
-
Esta é a média da população.
-
é o desvio padrão da população.
-
é o tamanho da amostra.
-
é uma variável definida pela distribuição normal padrão N(0,1).
Distribuição amostral de proporção
Na verdade, quando estudamos uma proporção de uma amostra, analisamos casos de sucesso. Portanto, a variável aleatória em estudo segue uma distribuição de probabilidade binomial.
De acordo com o teorema do limite central, para tamanhos grandes (n>30) podemos aproximar uma distribuição binomial de uma distribuição normal. Portanto, a distribuição amostral da proporção se aproxima de uma distribuição normal com os seguintes parâmetros:
Ouro
é a probabilidade de sucesso e
é a probabilidade de falha
.
Nota: Uma distribuição binomial só pode ser aproximada de uma distribuição normal se
E
.
Portanto, como a distribuição amostral da proporção pode ser aproximada a uma distribuição normal, a fórmula para calcular qualquer probabilidade relacionada à proporção de uma amostra é:
Ouro:
-
é a proporção da amostra.
-
é a proporção da população.
-
é a probabilidade de falha da população,
.
-
é o tamanho da amostra.
-
é uma variável definida pela distribuição normal padrão N(0,1).
Distribuição amostral de variância
A distribuição amostral de variância é definida pela distribuição de probabilidade qui-quadrado. Portanto, a fórmula para a estatística da distribuição amostral de variância é:
Ouro:
-
é a estatística da distribuição amostral de variância, que segue uma distribuição qui-quadrado.
-
é o tamanho da amostra.
-
é a variância da amostra.
-
é a variância populacional.
Distribuição amostral de diferença de médias
Se o tamanho da amostra for grande o suficiente (n 1 ≥30 en 2 ≥30), a distribuição amostral da diferença média segue uma distribuição normal. Mais precisamente, os parâmetros desta distribuição são calculados da seguinte forma:
Nota: Se ambas as populações forem distribuições normais, então a distribuição amostral da diferença nas médias segue uma distribuição normal, independentemente do tamanho da amostra.
Portanto, como a distribuição amostral da diferença de médias é definida por uma distribuição normal, a fórmula para calcular a estatística da distribuição amostral da diferença de médias é:
Ouro:
-
é a média da amostra i.
-
é a média da população i.
-
é o desvio padrão da população i.
-
é o tamanho da amostra i.
-
é uma variável definida pela distribuição normal padrão N(0,1).
Observe que amostras de populações diferentes podem ter tamanhos de amostra diferentes.
Distribuição amostral de diferença em proporções
As amostras selecionadas para a distribuição amostral por diferença de proporções são definidas por distribuições binomiais, porque para fins práticos uma proporção é uma razão entre casos de sucesso e o número total de observações.
No entanto, devido ao teorema do limite central, as distribuições binomiais podem ser aproximadas às distribuições normais de probabilidade. Portanto, a distribuição amostral da diferença de proporções pode ser aproximada a uma distribuição normal com as seguintes características:
Nota: A distribuição amostral da diferença de proporções só pode ser aproximada de uma distribuição normal se
,
,
,
,
E
.
Portanto, uma vez que a distribuição amostral da diferença de proporções pode ser aproximada de uma distribuição normal, a fórmula para calcular a estatística da distribuição amostral da diferença de proporções é a seguinte:
Ouro:
-
é a proporção da amostra i.
-
é a proporção da população i.
-
é a probabilidade de falha da população i,
.
-
é o tamanho da amostra i.
-
é uma variável definida pela distribuição normal padrão N(0,1).