O que é uma distribuição de probabilidade conjunta?


Uma tabela de frequência bidirecional é uma tabela que exibe as frequências (ou “contagens”) para duas variáveis categóricas.

Por exemplo, a tabela bidirecional a seguir mostra os resultados de uma pesquisa que perguntou a 100 pessoas qual esporte elas preferiam: beisebol, basquete ou futebol americano.

As linhas mostram o sexo do entrevistado e as colunas indicam o esporte escolhido:

Neste exemplo, existem duas variáveis: Esportes e Gênero.

Uma distribuição de probabilidade conjunta descreve simplesmente a probabilidade de um determinado indivíduo assumir dois valores específicos para as variáveis.

A palavra “conjunta” vem do fato de estarmos interessados na probabilidade de duas coisas acontecerem ao mesmo tempo.

Por exemplo, de um total de 100 indivíduos, 13 eram do sexo masculino e escolheram o beisebol como esporte favorito.

Então, diríamos que a probabilidade conjunta de um determinado indivíduo ser do sexo masculino e escolher o beisebol como esporte favorito é 13/100 = 0,13 ou 13% .

Escrito em notação matemática:

P(Gênero = Masculino, Esporte = Beisebol) = 13/100 = 0,13 .

Podemos usar este processo para calcular toda a distribuição de probabilidade conjunta:

  • P (Sexo = Masculino, Esporte = Beisebol) = 13/100 = 0,13
  • P(Sexo = Masculino, Esporte = Basquete) = 15/100 = 0,15
  • P(Gênero = Masculino, Esporte = Futebol) = 20/100 = 0,20
  • P (Sexo = Feminino, Esporte = Beisebol) = 23/100 = 0,23
  • P(Sexo = Feminino, Esporte = Basquete) = 16/100 = 0,16
  • P(Sexo = Feminino, Esporte = Futebol) = 13/100 = 0,13

Observe que a soma das probabilidades é igual a 1 ou 100% .

Por que usar uma distribuição de probabilidade conjunta?

As distribuições de probabilidade conjuntas são úteis porque frequentemente recolhemos dados para duas variáveis (como desporto e género) e queremos responder a questões relacionadas com ambas as variáveis.

Por exemplo, podemos querer compreender a probabilidade de um determinado indivíduo numa população ser do sexo masculino e preferir o basebol como desporto favorito.

Ou podemos estar interessados em compreender a probabilidade de um determinado indivíduo ser mulher e preferir o futebol como desporto favorito.

Uma distribuição de probabilidade conjunta pode ajudar-nos a responder a estas questões.

Use os exemplos a seguir como prática para entender melhor as distribuições de probabilidade conjunta.

Exemplo 1

A tabela bidirecional a seguir apresenta os resultados de uma pesquisa que perguntou a 238 pessoas que tipo de filme elas preferiam:

Exemplo de distribuição marginal com tabela bidirecional

Pergunta: Qual é a probabilidade de um determinado indivíduo ser mulher e preferir o drama como seu gênero de filme favorito?

Resposta: P (Gênero = Feminino, Gênero = Drama) = 58/238 = 0,244 = 24,4%

Exemplo 2

A tabela bidirecional a seguir mostra as notas dos exames de 64 alunos em uma turma com base no número de horas que passaram estudando:

Exemplo de distribuição marginal

Pergunta: Qual é a probabilidade de um determinado indivíduo estudar 2 horas e receber uma nota entre 91 e 100?

Resposta: P (Estudo = 2 horas, Pontuação = 91-100) = 3/64 = 0,047 = 4,7%

Recursos adicionais

O que é uma distribuição marginal?
Como encontrar a frequência relativa condicional em uma tabela de dupla entrada

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *