A condição de 10% nas estatísticas: definição e exemplo


Um ensaio de Bernoulli é uma experiência com apenas dois resultados possíveis – “sucesso” ou “fracasso” – e a probabilidade de sucesso é a mesma cada vez que a experiência é conduzida.

Um exemplo de ensaio de Bernoulli é o sorteio. A moeda só pode cair com duas caras (podemos chamar cara de “acerto” e coroa de “falha”) e a probabilidade de sucesso em cada lançamento é de 0,5, assumindo que a moeda é justa.

Muitas vezes, em estatística, quando queremos calcular probabilidades envolvendo mais do que algumas tentativas de Bernoulli, usamos a distribuição normal como aproximação. No entanto, para fazer isso devemos assumir que as tentativas são independentes.

Nos casos em que os ensaios não são verdadeiramente independentes, podemos sempre assumir que o são, se o tamanho da amostra com a qual estamos a trabalhar não exceder 10% do tamanho da população. Isso é chamado de condição de 10% .

A condição de 10%: Contanto que o tamanho da amostra seja menor ou igual a 10% do tamanho da população, podemos sempre assumir que os testes de Bernoulli são independentes.

Intuição por trás da condição de 10%

Para desenvolver uma intuição por trás da condição de 10%, considere o exemplo a seguir.

Suponha que a verdadeira proporção de alunos de uma determinada turma que preferem o futebol ao basquete seja de 50%. Sejaa variável aleatória X o número de alunos selecionados aleatoriamente em 4 tentativas que preferem futebol ao basquete. Digamos que queremos compreender a probabilidade de os 4 alunos selecionados aleatoriamente preferirem futebol a basquetebol.

Se o tamanho da nossa turma for de 20 alunos e os nossos testes forem independentes (por exemplo, poderíamos obter amostras repetidas de todos os 20 alunos), então a probabilidade de cada aluno preferir o futebol ao basquetebol poderia ser calculada da seguinte forma:

P(Os 4 alunos preferem futebol) = 20/10 * 20/10 * 20/10 * 20/10 = 0,0625 .

No entanto, se os nossos ensaios não forem independentes (por exemplo, uma vez amostrados um aluno, este não pode ser devolvido à aula), então a probabilidade de todos os 4 alunos preferirem futebol seria calculada da seguinte forma:

P(Os 4 alunos preferem futebol) = 20/10 * 19/09 * 18/08 * 17/07 = 0,0433 .

Essas duas probabilidades são muito diferentes. Considere que neste exemplo o tamanho da nossa amostra (4 alunos) não é menor ou igual a 10% da população (20 alunos), portanto não poderemos utilizar a condição de 10%.

No entanto, considere a tabela a seguir que mostra a probabilidade de os 4 alunos selecionados aleatoriamente preferirem futebol, com base no tamanho da turma:

10 por cento de estado nas estatísticas

À medida que o tamanho da amostra em relação ao tamanho da população (por exemplo, “tamanho da turma” neste exemplo) diminui, a probabilidade calculada entre ensaios independentes e ensaios não independentes fica cada vez mais próxima.

Observe que quando o tamanho da amostra é exatamente 10% do tamanho da população, a diferença entre as probabilidades de ensaios independentes e ensaios não independentes é relativamente semelhante.

E quando o tamanho da amostra é muito inferior a 10% do tamanho da população (por exemplo, apenas 0,4% do tamanho da população na última linha da tabela), as probabilidades entre ensaios independentes e não independentes são extremamente próximas.

Conclusão

A condição de 10% afirma que o tamanho da nossa amostra deve ser menor ou igual a 10% do tamanho da população para assumir com segurança que um conjunto de ensaios de Bernoulli é independente.

Obviamente, é melhor que o tamanho da nossa amostra seja bem inferior a 10% do tamanho da população, para que as nossas inferências sobre a população sejam tão precisas quanto possível. Por exemplo, preferiríamos que o tamanho da nossa amostra fosse de apenas 5% da população em vez de 10%.

Recursos adicionais

Uma introdução à distribuição normal
Uma introdução à distribuição binomial
Uma introdução ao teorema do limite central

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *