Distribuição de amostras
Este artigo explica o que é distribuição amostral em estatísticas e para que ela é usada. Assim você encontrará o significado de uma distribuição amostral, um exemplo concreto de distribuição amostral e, além disso, as fórmulas para os tipos mais comuns de distribuições amostrais.
Qual é a distribuição amostral?
A distribuição amostral , ou distribuição amostral , é a distribuição que resulta da consideração de todas as amostras possíveis de uma população. Em outras palavras, a distribuição amostral é a distribuição obtida calculando um parâmetro amostral de todas as amostras possíveis de uma população.
Por exemplo, se extrairmos todas as amostras possíveis de uma população estatística e calcularmos a média de cada amostra, o conjunto de médias amostrais forma uma distribuição amostral. Mais precisamente, como o parâmetro calculado é a média aritmética, é a distribuição amostral da média.
Nas estatísticas, a distribuição amostral é usada para calcular a probabilidade de aproximação do valor do parâmetro populacional ao estudar uma única amostra. Da mesma forma, a distribuição amostral nos permite estimar o erro amostral para um determinado tamanho de amostra.
Exemplo de distribuição de amostragem
Agora que conhecemos a definição de distribuição amostral, vejamos um exemplo simples para compreender totalmente o conceito.
- Numa caixa colocamos três bolas e cada uma tem um número escrito de um a três, de forma que uma bola tem o número 1, outra bola tem o número 2 e a última bola tem o número 3. Para uma amostra de tamanho n = 2, calcula as probabilidades da distribuição amostral da média se forem selecionadas amostras com reposição.
As amostras são selecionadas com reposição, ou seja, a bola recolhida para selecionar o primeiro elemento da amostra é devolvida à caixa e pode ser selecionada novamente na segunda extração. Portanto, todas as amostras possíveis da população são:
1,1 1,2 1,3
2,1 2,2 2,3
3,1 3,2 3,3
Assim, calculamos a média aritmética de cada amostra possível:
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
Portanto, as probabilidades de obter cada valor da média amostral ao selecionar uma amostra aleatória da população são as seguintes:

As probabilidades da distribuição amostral apresentadas na tabela acima foram calculadas dividindo o número de amostras com o referido valor médio pelo número total de casos possíveis. Por exemplo: a média amostral é 1,5 em dois casos entre nove possíveis, portanto P(1,5)=2/9.
Tipos de distribuições amostrais
As distribuições amostrais (ou distribuições amostrais) podem ser classificadas com base no parâmetro amostral a partir do qual foram obtidas. Portanto, os tipos mais comuns de distribuições são os seguintes:
- Distribuição amostral da média : É a distribuição amostral que resulta do cálculo da média aritmética de cada amostra.
- Distribuição Amostragem Proporcional : É a distribuição amostral obtida calculando a proporção de todas as amostras.
- Distribuição amostral de variância : Esta é a distribuição amostral que forma o conjunto de todas as variâncias na amostra.
- Distribuição amostral por diferença de médias : é a distribuição amostral que resulta do cálculo da diferença entre as médias de todas as amostras possíveis de duas populações diferentes.
- Distribuição amostral por diferença de proporções : é a distribuição amostral obtida subtraindo todas as proporções amostrais possíveis de duas populações.
Cada tipo de distribuição amostral é explicado com mais detalhes abaixo.
Distribuição amostral da média
Dada uma população que segue uma distribuição de probabilidade normal com média
![]()
e desvio padrão
![]()
e amostras de tamanho são extraídas
![]()
, a distribuição amostral da média também será definida por uma distribuição normal com as seguintes características:
![Rendered by QuickLaTeX.com \begin{array}{c}\mu_{\overline{x}}=\mu \qquad \sigma_{\overline{x}}=\cfrac{\sigma}{\sqrt{n}}\\[4ex]\displaystyle N_{\overline{x}}\left(\mu, \frac{\sigma}{\sqrt{n}}\right) \end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-44571aa7337b095ab9c9fa1f746e93a5_l3.png)
Ouro
![]()
é a média da distribuição amostral da média e
![]()
é o seu desvio padrão. Além disso,
![]()
é o erro padrão da distribuição amostral.
Nota: Se a população não seguir uma distribuição normal, mas o tamanho da amostra for grande (n>30), a distribuição amostral da média também pode ser aproximada à distribuição normal acima pelo limite do teorema central.
Portanto, como a distribuição amostral da média segue uma distribuição normal, a fórmula para calcular qualquer probabilidade relacionada à média amostral é:

Ouro:
-

é a média amostral.
-

Esta é a média da população.
-

é o desvio padrão da população.
-

é o tamanho da amostra.
-

é uma variável definida pela distribuição normal padrão N(0,1).
Distribuição amostral de proporção
Na verdade, quando estudamos uma proporção de uma amostra, analisamos casos de sucesso. Portanto, a variável aleatória em estudo segue uma distribuição de probabilidade binomial.
De acordo com o teorema do limite central, para tamanhos grandes (n>30) podemos aproximar uma distribuição binomial de uma distribuição normal. Portanto, a distribuição amostral da proporção se aproxima de uma distribuição normal com os seguintes parâmetros:
![Rendered by QuickLaTeX.com \begin{array}{c}\displaystyle\mu_{p}=p \qquad \sigma_{p}=\sqrt{\frac{pq}{n}}\\[4ex]\displaystyle N_{p}\left(p, \sqrt{\frac{pq}{n}}\right) \end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-f3408076893f390bb65baecfe38e6eff_l3.png)
Ouro
![]()
é a probabilidade de sucesso e
![]()
é a probabilidade de falha
![]()
.
Nota: Uma distribuição binomial só pode ser aproximada de uma distribuição normal se

![]()
E
![]()
.
Portanto, como a distribuição amostral da proporção pode ser aproximada a uma distribuição normal, a fórmula para calcular qualquer probabilidade relacionada à proporção de uma amostra é:

Ouro:
-

é a proporção da amostra.
-

é a proporção da população.
-

é a probabilidade de falha da população,

.
-

é o tamanho da amostra.
-

é uma variável definida pela distribuição normal padrão N(0,1).
Distribuição amostral de variância
A distribuição amostral de variância é definida pela distribuição de probabilidade qui-quadrado. Portanto, a fórmula para a estatística da distribuição amostral de variância é:
![]()
Ouro:
-

é a estatística da distribuição amostral de variância, que segue uma distribuição qui-quadrado.
-

é o tamanho da amostra.
-

é a variância da amostra.
-

é a variância populacional.
Distribuição amostral de diferença de médias
Se o tamanho da amostra for grande o suficiente (n 1 ≥30 en 2 ≥30), a distribuição amostral da diferença média segue uma distribuição normal. Mais precisamente, os parâmetros desta distribuição são calculados da seguinte forma:
![Rendered by QuickLaTeX.com \begin{array}{c}\displaystyle \mu_{\overline{x_1}-\overline{x_2}}=\mu_1-\mu_2 \qquad \sigma_{\overline{x_1}-\overline{x_2}}=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\\[6ex]\displaystyle N_{\overline{x_1}-\overline{x_2}}\left(\mu_1-\mu_2, \sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right) \end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-90c67b74b4e9326b7869d641a59725d9_l3.png)
Nota: Se ambas as populações forem distribuições normais, então a distribuição amostral da diferença nas médias segue uma distribuição normal, independentemente do tamanho da amostra.
Portanto, como a distribuição amostral da diferença de médias é definida por uma distribuição normal, a fórmula para calcular a estatística da distribuição amostral da diferença de médias é:

Ouro:
-

é a média da amostra i.
-

é a média da população i.
-

é o desvio padrão da população i.
-

é o tamanho da amostra i.
-

é uma variável definida pela distribuição normal padrão N(0,1).
Observe que amostras de populações diferentes podem ter tamanhos de amostra diferentes.
Distribuição amostral de diferença em proporções
As amostras selecionadas para a distribuição amostral por diferença de proporções são definidas por distribuições binomiais, porque para fins práticos uma proporção é uma razão entre casos de sucesso e o número total de observações.
No entanto, devido ao teorema do limite central, as distribuições binomiais podem ser aproximadas às distribuições normais de probabilidade. Portanto, a distribuição amostral da diferença de proporções pode ser aproximada a uma distribuição normal com as seguintes características:
![Rendered by QuickLaTeX.com \begin{array}{c}\displaystyle\mu_{\widehat{p_1}-\widehat{p_2}}=p_1-p_2 \qquad \sigma_{\widehat{p_1}-\widehat{p_2}}=\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\\[6ex]\displaystyle N_{p}\left(p_1-p_2, \sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\right) \end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-a1ce359b5dd6d80f8d27b0b9a1034bed_l3.png)
Nota: A distribuição amostral da diferença de proporções só pode ser aproximada de uma distribuição normal se
![]()
,
![]()
,
![]()
,
![]()
,
![]()
E
![]()
.
Portanto, uma vez que a distribuição amostral da diferença de proporções pode ser aproximada de uma distribuição normal, a fórmula para calcular a estatística da distribuição amostral da diferença de proporções é a seguinte:

Ouro:
-

é a proporção da amostra i.
-

é a proporção da população i.
-

é a probabilidade de falha da população i,

.
-

é o tamanho da amostra i.
-

é uma variável definida pela distribuição normal padrão N(0,1).