O que é uma distribuição categórica?
Uma distribuição categórica é uma distribuição de probabilidade discreta que descreve a probabilidade de uma variável aleatória assumir um valor pertencente a uma das K categorias, onde cada categoria está associada a uma probabilidade.
Para que uma distribuição seja classificada como distribuição categórica, ela deve atender aos seguintes critérios:
- As categorias são discretas.
- Existem duas ou mais categorias potenciais.
- A probabilidade de a variável aleatória assumir um valor em cada categoria deve estar entre 0 e 1.
- A soma das probabilidades para todas as categorias deve somar 1.
O exemplo mais óbvio de distribuição categórica é a distribuição de resultados associados ao lançamento de um dado. Existem K = 6 resultados potenciais e a probabilidade de cada resultado é 1/6:
Esta distribuição atende a todos os critérios para ser classificada como distribuição categórica:
- As categorias são discretas (por exemplo, a variável aleatória só pode assumir valores discretos – 1, 2, 3, 4, 5, 6)
- Existem duas ou mais categorias potenciais.
- A probabilidade de cada categoria está entre 0 e 1.
- A soma das probabilidades totaliza 1: 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.
Regra geral:
Se você puder contar o número de resultados, então estará trabalhando com uma variável aleatória discreta – por exemplo, contando o número de vezes que uma moeda dá cara.
Mas se você puder medir o resultado, estará trabalhando com uma variável aleatória contínua – por exemplo, medindo altura, peso, tempo, etc.
Outros exemplos de distribuições categóricas
Existem muitas distribuições categóricas no mundo real, incluindo:
Exemplo 1: Jogue uma moeda.
Quando jogamos uma moeda, existem 2 resultados discretos potenciais, a probabilidade de cada resultado está entre 0 e 1 e a soma das probabilidades é igual a 1:
Exemplo 2: Seleção de bolinhas de gude em uma urna.
Suponha que uma urna contenha 5 bolinhas vermelhas, 3 bolinhas verdes e 2 bolinhas roxas. Se selecionarmos aleatoriamente uma bola da urna, existem 3 resultados discretos potenciais, a probabilidade de cada resultado está entre 0 e 1 e a soma das probabilidades é igual a 1:
Exemplo 3: Selecionando uma carta de um baralho.
Se selecionarmos aleatoriamente uma carta de um baralho padrão de 52 cartas, existem 13 resultados discretos potenciais, a probabilidade de cada resultado está entre 0 e 1, e a soma das probabilidades é igual a 1:
Relacionamento com outras distribuições
Para que uma distribuição seja classificada como distribuição categórica , ela deve ter K ≥ 2 resultados potenciais en = 1 tentativa.
Usando esta terminologia, uma distribuição categórica é semelhante às seguintes distribuições:
Distribuição de Bernoulli: K = 2 resultados, n = 1 teste
Distribuição binomial: K = 2 pontos finais, n ≥ 1 tentativa
Distribuição multinomial: K ≥ 2 resultados, n ≥ tentativa
Recursos adicionais
O que são variáveis aleatórias?
Uma introdução à distribuição binomial
Uma introdução à distribuição multinomial