Qual é a condição de aprovação/reprovação nas estatísticas?
Um ensaio de Bernoulli é uma experiência com apenas dois resultados possíveis – “sucesso” ou “fracasso” – e a probabilidade de sucesso é a mesma cada vez que a experiência é conduzida.
Um exemplo de ensaio de Bernoulli é o sorteio. A moeda só pode cair com duas caras (podemos chamar cara de “acerto” e coroa de “falha”) e a probabilidade de sucesso em cada lançamento é de 0,5, assumindo que a moeda é justa.
Muitas vezes, em estatística, quando queremos calcular probabilidades envolvendo mais do que algumas tentativas de Bernoulli, usamos a distribuição normal como aproximação. No entanto, para fazer isso, precisamos verificar se a condição de aprovação/reprovação foi atendida:
Condição de aprovação/reprovação: deve haver pelo menos 10 sucessos esperados e 10 falhas esperadas em uma amostra para usar a distribuição normal como aproximação.
Escrito em notação, precisamos verificar as duas coisas a seguir:
- O número esperado de sucessos é de pelo menos 10: np ≥ 10
- O número esperado de falhas é de pelo menos 10: n(1-p) ≥ 10
onde n é o tamanho da amostra e p é a probabilidade de sucesso de uma determinada tentativa.
Nota: Alguns manuais dizem que apenas 5 sucessos esperados e 5 falhas esperadas são necessários para usar a aproximação normal. No entanto, 10 é mais comumente usado e é um número mais conservador. Portanto, usaremos esse número neste tutorial.
Exemplo: Verificando a condição de aprovação/reprovação
Suponha que queiramos criar um intervalo de confiança para a proporção de residentes num condado que são a favor de uma determinada lei. Selecionamos uma amostra aleatória de 100 residentes e perguntamos qual é a sua posição em relação à lei. Aqui estão os resultados:
- Tamanho da amostra n = 100
- Proporção a favor da lei p = 0,56
Gostaríamos de usar a seguinte fórmula para calcular o intervalo de confiança:
Intervalo de confiança = p +/- z*√ p(1-p) / n
Ouro:
- p: proporção da amostra
- z: o valor z que corresponde à distribuição normal
- n: tamanho da amostra
Esta fórmula usa um valor z da distribuição normal. Portanto, nesta fórmula usamos a distribuição normal para aproximar a distribuição binomial.
No entanto, para fazer isso, precisamos verificar se a condição de aprovação/reprovação foi atendida. Vamos verificar se o número de sucessos e o número de falhas na amostra são pelo menos 10:
Número de sucessos: np = 100*0,56 = 56
Número de falhas: n(1-p) = 100*(1-0,56) = 44
Ambos os números são iguais ou maiores que 10, portanto podemos usar a fórmula acima para calcular o intervalo de confiança.
Recursos adicionais
Outra condição que deve ser atendida para usar a distribuição normal como aproximação da distribuição binomial é que o tamanho da amostra com a qual estamos trabalhando não exceda 10% do tamanho da população. Isso é chamado de condição de 10%.
Lembre-se também de que se você estiver trabalhando com duas proporções (por exemplo , criando um intervalo de confiança para a diferença entre as proporções ), será necessário verificar se o número esperado de acertos e fracassos nas duas amostras é de pelo menos 10.