Uma introdução à distribuição hipergeométrica
A distribuição hipergeométrica descreve a probabilidade de escolher k objetos com uma determinada característica em n sorteios sem reposição, a partir de uma população finita de tamanho N contendo K objetos com esta característica.
Se uma variável aleatória X segue uma distribuição hipergeométrica, então a probabilidade de escolher k objetos com uma determinada característica pode ser encontrada pela seguinte fórmula:
P(X=k) = K C k ( NK C nk ) / N C n
Ouro:
- N: tamanho da população
- K: número de objetos na população com uma determinada característica
- n: tamanho da amostra
- k: número de objetos na amostra com uma determinada funcionalidade
- K C k : número de combinações de K coisas tiradas k de cada vez
Por exemplo, existem 4 Rainhas em um baralho padrão de 52 cartas. Suponha que escolhemos aleatoriamente uma carta de um baralho e então, sem reposição, escolhemos aleatoriamente outra carta do baralho. Qual é a probabilidade de ambas as cartas serem Damas?
Para responder isso, podemos usar a distribuição hipergeométrica com os seguintes parâmetros:
- N: tamanho da população = 52 cartas
- K: número de objetos na população com uma determinada característica = 4 rainhas
- n: tamanho da amostra = 2 sorteios
- k: número de objetos na amostra com uma determinada característica = 2 rainhas
Colocando esses números na fórmula, descobrimos que a probabilidade é:
P(X=2) = K C k ( NK C nk ) / N C n = 4 C 2 ( 52-4 C 2-2 ) / 52 C 2 = 6*1/ 1326 = 0,00452 .
Isso deve fazer sentido intuitivamente. Se você imaginar tirar duas cartas de um baralho, uma após a outra, a probabilidade de ambas as cartas serem Damas deve ser muito baixa.
Propriedades da distribuição hipergeométrica
A distribuição hipergeométrica tem as seguintes propriedades:
A média da distribuição é (nK) / N
A variância da distribuição é (nK)(NK)(Nn) / (N 2 (n-1))
Problemas práticos de distribuição hipergeométrica
Use os seguintes problemas práticos para testar seu conhecimento sobre a distribuição hipergeométrica.
Nota: Usaremos a Calculadora de Distribuição Hipergeométrica para calcular as respostas a essas perguntas.
Problema 1
Pergunta: Suponha que escolhemos aleatoriamente quatro cartas de um baralho sem substituí-las. Qual é a probabilidade de duas das cartas serem Damas?
Para responder isso, podemos usar a distribuição hipergeométrica com os seguintes parâmetros:
- N: tamanho da população = 52 cartas
- K: número de objetos na população com uma determinada característica = 4 rainhas
- n: tamanho da amostra = 4 sorteios
- k: número de objetos na amostra com uma determinada característica = 2 rainhas
Colocando esses números na calculadora de distribuição hipergeométrica, descobrimos que a probabilidade é 0,025 .
Problema 2
Pergunta: Uma urna contém 3 bolas vermelhas e 5 bolas verdes. Você escolhe aleatoriamente 4 bolas. Qual é a probabilidade de você escolher exatamente 2 bolas vermelhas?
Para responder isso, podemos usar a distribuição hipergeométrica com os seguintes parâmetros:
- N: tamanho da população = 8 bolas
- K: número de objetos na população com uma determinada característica = 3 bolas vermelhas
- n: tamanho da amostra = 4 sorteios
- k: número de objetos na amostra com uma determinada característica = 2 bolas vermelhas
Colocando esses números na calculadora de distribuição hipergeométrica, descobrimos que a probabilidade é 0,42857 .
Problema 3
Pergunta: Uma cesta contém 7 bolinhas roxas e 3 bolinhas rosa. Você escolhe aleatoriamente 6 bolinhas de gude. Qual é a probabilidade de você escolher exatamente 3 bolinhas rosa?
Para responder isso, podemos usar a distribuição hipergeométrica com os seguintes parâmetros:
- N: tamanho da população = 10 bolinhas de gude
- K: número de objetos na população com uma determinada característica = 3 bolas rosa
- n: tamanho da amostra = 6 sorteios
- k: número de objetos na amostra com uma determinada característica = 3 bolas rosa
Colocando esses números na calculadora de distribuição hipergeométrica, descobrimos que a probabilidade é 0,16667 .