O que é uma distribuição de probabilidade conjunta?
Uma tabela de frequência bidirecional é uma tabela que exibe as frequências (ou “contagens”) para duas variáveis categóricas.
Por exemplo, a tabela bidirecional a seguir mostra os resultados de uma pesquisa que perguntou a 100 pessoas qual esporte elas preferiam: beisebol, basquete ou futebol americano.
As linhas mostram o sexo do entrevistado e as colunas indicam o esporte escolhido:
Neste exemplo, existem duas variáveis: Esportes e Gênero.
Uma distribuição de probabilidade conjunta descreve simplesmente a probabilidade de um determinado indivíduo assumir dois valores específicos para as variáveis.
A palavra “conjunta” vem do fato de estarmos interessados na probabilidade de duas coisas acontecerem ao mesmo tempo.
Por exemplo, de um total de 100 indivíduos, 13 eram do sexo masculino e escolheram o beisebol como esporte favorito.
Então, diríamos que a probabilidade conjunta de um determinado indivíduo ser do sexo masculino e escolher o beisebol como esporte favorito é 13/100 = 0,13 ou 13% .
Escrito em notação matemática:
P(Gênero = Masculino, Esporte = Beisebol) = 13/100 = 0,13 .
Podemos usar este processo para calcular toda a distribuição de probabilidade conjunta:
- P (Sexo = Masculino, Esporte = Beisebol) = 13/100 = 0,13
- P(Sexo = Masculino, Esporte = Basquete) = 15/100 = 0,15
- P(Gênero = Masculino, Esporte = Futebol) = 20/100 = 0,20
- P (Sexo = Feminino, Esporte = Beisebol) = 23/100 = 0,23
- P(Sexo = Feminino, Esporte = Basquete) = 16/100 = 0,16
- P(Sexo = Feminino, Esporte = Futebol) = 13/100 = 0,13
Observe que a soma das probabilidades é igual a 1 ou 100% .
Por que usar uma distribuição de probabilidade conjunta?
As distribuições de probabilidade conjuntas são úteis porque frequentemente recolhemos dados para duas variáveis (como desporto e género) e queremos responder a questões relacionadas com ambas as variáveis.
Por exemplo, podemos querer compreender a probabilidade de um determinado indivíduo numa população ser do sexo masculino e preferir o basebol como desporto favorito.
Ou podemos estar interessados em compreender a probabilidade de um determinado indivíduo ser mulher e preferir o futebol como desporto favorito.
Uma distribuição de probabilidade conjunta pode ajudar-nos a responder a estas questões.
Use os exemplos a seguir como prática para entender melhor as distribuições de probabilidade conjunta.
Exemplo 1
A tabela bidirecional a seguir apresenta os resultados de uma pesquisa que perguntou a 238 pessoas que tipo de filme elas preferiam:
Pergunta: Qual é a probabilidade de um determinado indivíduo ser mulher e preferir o drama como seu gênero de filme favorito?
Resposta: P (Gênero = Feminino, Gênero = Drama) = 58/238 = 0,244 = 24,4%
Exemplo 2
A tabela bidirecional a seguir mostra as notas dos exames de 64 alunos em uma turma com base no número de horas que passaram estudando:
Pergunta: Qual é a probabilidade de um determinado indivíduo estudar 2 horas e receber uma nota entre 91 e 100?
Resposta: P (Estudo = 2 horas, Pontuação = 91-100) = 3/64 = 0,047 = 4,7%
Recursos adicionais
O que é uma distribuição marginal?
Como encontrar a frequência relativa condicional em uma tabela de dupla entrada