Distribuição de amostras

Este artigo explica o que é distribuição amostral em estatísticas e para que ela é usada. Assim você encontrará o significado de uma distribuição amostral, um exemplo concreto de distribuição amostral e, além disso, as fórmulas para os tipos mais comuns de distribuições amostrais.

Qual é a distribuição amostral?

A distribuição amostral , ou distribuição amostral , é a distribuição que resulta da consideração de todas as amostras possíveis de uma população. Em outras palavras, a distribuição amostral é a distribuição obtida calculando um parâmetro amostral de todas as amostras possíveis de uma população.

Por exemplo, se extrairmos todas as amostras possíveis de uma população estatística e calcularmos a média de cada amostra, o conjunto de médias amostrais forma uma distribuição amostral. Mais precisamente, como o parâmetro calculado é a média aritmética, é a distribuição amostral da média.

Nas estatísticas, a distribuição amostral é usada para calcular a probabilidade de aproximação do valor do parâmetro populacional ao estudar uma única amostra. Da mesma forma, a distribuição amostral nos permite estimar o erro amostral para um determinado tamanho de amostra.

Exemplo de distribuição de amostragem

Agora que conhecemos a definição de distribuição amostral, vejamos um exemplo simples para compreender totalmente o conceito.

  • Numa caixa colocamos três bolas e cada uma tem um número escrito de um a três, de forma que uma bola tem o número 1, outra bola tem o número 2 e a última bola tem o número 3. Para uma amostra de tamanho n = 2, calcula as probabilidades da distribuição amostral da média se forem selecionadas amostras com reposição.

As amostras são selecionadas com reposição, ou seja, a bola recolhida para selecionar o primeiro elemento da amostra é devolvida à caixa e pode ser selecionada novamente na segunda extração. Portanto, todas as amostras possíveis da população são:

1,1 1,2 1,3
2,1 2,2 2,3
3,1 3,2 3,3

Assim, calculamos a média aritmética de cada amostra possível:

(1,1) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{11}=\cfrac{1+1}{2}=1

(1,2) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{12}=\cfrac{1+2}{2}=1,5

(1,3) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{13}=\cfrac{1+3}{2}=2

(2,1) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{21}=\cfrac{2+1}{2}=1,5

(2,2) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{22}=\cfrac{2+2}{2}=2

(2,3) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{23}=\cfrac{2+3}{2}=2,5

(3,1) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{31}=\cfrac{3+1}{2}=2

(3,2) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{32}=\cfrac{3+2}{2}=2,5

(3,3) \ \color{orange}\bm{\longrightarrow}\color{black} \ \overline{x}_{33}=\cfrac{3+3}{2}=3

Portanto, as probabilidades de obter cada valor da média amostral ao selecionar uma amostra aleatória da população são as seguintes:

exemplo de tabela de distribuição de amostra

As probabilidades da distribuição amostral apresentadas na tabela acima foram calculadas dividindo o número de amostras com o referido valor médio pelo número total de casos possíveis. Por exemplo: a média amostral é 1,5 em dois casos entre nove possíveis, portanto P(1,5)=2/9.

Tipos de distribuições amostrais

As distribuições amostrais (ou distribuições amostrais) podem ser classificadas com base no parâmetro amostral a partir do qual foram obtidas. Portanto, os tipos mais comuns de distribuições são os seguintes:

  • Distribuição amostral da média : É a distribuição amostral que resulta do cálculo da média aritmética de cada amostra.
  • Distribuição Amostragem Proporcional : É a distribuição amostral obtida calculando a proporção de todas as amostras.
  • Distribuição amostral de variância : Esta é a distribuição amostral que forma o conjunto de todas as variâncias na amostra.
  • Distribuição amostral por diferença de médias : é a distribuição amostral que resulta do cálculo da diferença entre as médias de todas as amostras possíveis de duas populações diferentes.
  • Distribuição amostral por diferença de proporções : é a distribuição amostral obtida subtraindo todas as proporções amostrais possíveis de duas populações.

Cada tipo de distribuição amostral é explicado com mais detalhes abaixo.

Distribuição amostral da média

Dada uma população que segue uma distribuição de probabilidade normal com média

\mu

e desvio padrão

\sigma

e amostras de tamanho são extraídas

n

, a distribuição amostral da média também será definida por uma distribuição normal com as seguintes características:

\begin{array}{c}\mu_{\overline{x}}=\mu \qquad \sigma_{\overline{x}}=\cfrac{\sigma}{\sqrt{n}}\\[4ex]\displaystyle N_{\overline{x}}\left(\mu, \frac{\sigma}{\sqrt{n}}\right) \end{array}

Ouro

\mu_{\overline{x}}

é a média da distribuição amostral da média e

\sigma_{\overline{x}}

é o seu desvio padrão. Além disso,

\cfrac{\sigma}{\sqrt{n}}

é o erro padrão da distribuição amostral.

Nota: Se a população não seguir uma distribuição normal, mas o tamanho da amostra for grande (n>30), a distribuição amostral da média também pode ser aproximada à distribuição normal acima pelo limite do teorema central.

Portanto, como a distribuição amostral da média segue uma distribuição normal, a fórmula para calcular qualquer probabilidade relacionada à média amostral é:

Z=\cfrac{\overline{x}-\mu}{\displaystyle\frac{\sigma}{\sqrt{n}}}

Ouro:

  • \overline{x}

    é a média amostral.

  • \mu

    Esta é a média da população.

  • s

    é o desvio padrão da população.

  • n

    é o tamanho da amostra.

  • Z

    é uma variável definida pela distribuição normal padrão N(0,1).

Distribuição amostral de proporção

Na verdade, quando estudamos uma proporção de uma amostra, analisamos casos de sucesso. Portanto, a variável aleatória em estudo segue uma distribuição de probabilidade binomial.

De acordo com o teorema do limite central, para tamanhos grandes (n>30) podemos aproximar uma distribuição binomial de uma distribuição normal. Portanto, a distribuição amostral da proporção se aproxima de uma distribuição normal com os seguintes parâmetros:

\begin{array}{c}\displaystyle\mu_{p}=p \qquad \sigma_{p}=\sqrt{\frac{pq}{n}}\\[4ex]\displaystyle N_{p}\left(p, \sqrt{\frac{pq}{n}}\right) \end{array}

Ouro

p

é a probabilidade de sucesso e

q

é a probabilidade de falha

q=1-p

.

Nota: Uma distribuição binomial só pode ser aproximada de uma distribuição normal se

n>30″ title=”Rendered by QuickLaTeX.com” height=”14″ width=”52″ style=”vertical-align: -2px;”></p>
<p> ,</p>
<p class=np\ge 5

E

nq\ge 5

.

Portanto, como a distribuição amostral da proporção pode ser aproximada a uma distribuição normal, a fórmula para calcular qualquer probabilidade relacionada à proporção de uma amostra é:

Z=\cfrac{\widehat{p}-p}{\displaystyle\sqrt{\frac{pq}{n}}}

Ouro:

  • \widehat{p}

    é a proporção da amostra.

  • p

    é a proporção da população.

  • q

    é a probabilidade de falha da população,

    q=1-p

    .

  • n

    é o tamanho da amostra.

  • Z

    é uma variável definida pela distribuição normal padrão N(0,1).

Distribuição amostral de variância

A distribuição amostral de variância é definida pela distribuição de probabilidade qui-quadrado. Portanto, a fórmula para a estatística da distribuição amostral de variância é:

\chi^2=\cfrac{(n-1)s^2}{\sigma^2}

Ouro:

  • \chi^2

    é a estatística da distribuição amostral de variância, que segue uma distribuição qui-quadrado.

  • n

    é o tamanho da amostra.

  • s^2

    é a variância da amostra.

  • \sigma^2

    é a variância populacional.

Distribuição amostral de diferença de médias

Se o tamanho da amostra for grande o suficiente (n 1 ≥30 en 2 ≥30), a distribuição amostral da diferença média segue uma distribuição normal. Mais precisamente, os parâmetros desta distribuição são calculados da seguinte forma:

\begin{array}{c}\displaystyle \mu_{\overline{x_1}-\overline{x_2}}=\mu_1-\mu_2 \qquad \sigma_{\overline{x_1}-\overline{x_2}}=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\\[6ex]\displaystyle N_{\overline{x_1}-\overline{x_2}}\left(\mu_1-\mu_2, \sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right) \end{array}

Nota: Se ambas as populações forem distribuições normais, então a distribuição amostral da diferença nas médias segue uma distribuição normal, independentemente do tamanho da amostra.

Portanto, como a distribuição amostral da diferença de médias é definida por uma distribuição normal, a fórmula para calcular a estatística da distribuição amostral da diferença de médias é:

Z=\cfrac{(\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}

Ouro:

  • \overline{x_i}

    é a média da amostra i.

  • \mu_i

    é a média da população i.

  • \sigma_i

    é o desvio padrão da população i.

  • n_i

    é o tamanho da amostra i.

  • Z

    é uma variável definida pela distribuição normal padrão N(0,1).

Observe que amostras de populações diferentes podem ter tamanhos de amostra diferentes.

Distribuição amostral de diferença em proporções

As amostras selecionadas para a distribuição amostral por diferença de proporções são definidas por distribuições binomiais, porque para fins práticos uma proporção é uma razão entre casos de sucesso e o número total de observações.

No entanto, devido ao teorema do limite central, as distribuições binomiais podem ser aproximadas às distribuições normais de probabilidade. Portanto, a distribuição amostral da diferença de proporções pode ser aproximada a uma distribuição normal com as seguintes características:

\begin{array}{c}\displaystyle\mu_{\widehat{p_1}-\widehat{p_2}}=p_1-p_2 \qquad \sigma_{\widehat{p_1}-\widehat{p_2}}=\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\\[6ex]\displaystyle N_{p}\left(p_1-p_2, \sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\right) \end{array}

Nota: A distribuição amostral da diferença de proporções só pode ser aproximada de uma distribuição normal se

n_1\geq30

,

n_2\geq 30

,

n_1p_1\geq5

,

n_2p_2\geq5

,

n_1q_1\geq5

E

n_2q_2\geq5

.

Portanto, uma vez que a distribuição amostral da diferença de proporções pode ser aproximada de uma distribuição normal, a fórmula para calcular a estatística da distribuição amostral da diferença de proporções é a seguinte:

Z=\cfrac{(\widehat{p_1}-\widehat{p_2})-(p_1-p_2)}{\displaystyle\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}}

Ouro:

  • \widehat{p_i}

    é a proporção da amostra i.

  • p_i

    é a proporção da população i.

  • q_i

    é a probabilidade de falha da população i,

    q_i=1-p_i

    .

  • n_i

    é o tamanho da amostra i.

  • Z

    é uma variável definida pela distribuição normal padrão N(0,1).

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *