O que são variáveis dicotômicas? (definição e #038; exemplo)
Uma variável dicotômica é um tipo de variável que assume apenas dois valores possíveis.
Aqui estão alguns exemplos de variáveis dicotômicas:
- Gênero: Masculino ou Feminino
- Coin Flip: cara ou coroa
- Tipo de imóvel: Residencial ou Comercial
- Status do atleta: Profissional ou Amador
- Resultados do exame: aprovação ou reprovação
Esses tipos de variáveis surgem o tempo todo na prática. Por exemplo, considere o seguinte conjunto de dados que contém 10 observações e 4 variáveis:
As variáveis gênero e Campeonato conquistado são dicotômicas porque cada uma só pode assumir dois valores possíveis:
Porém, as variáveis Divisão e Pontos Médios não são dicotômicas porque podem assumir vários valores.
Dica bônus:
Você pode lembrar que variáveis dicotômicas só podem assumir dois valores lembrando que o prefixo “di” é uma palavra grega que significa “dois”, “duas vezes” ou “duplo”.
Como criar variáveis dicotômicas
Deve-se notar que podemos criar uma variável dicotômica a partir de uma variável contínua simplesmente separando os valores com base em um determinado limite.
Por exemplo, no conjunto de dados anterior, poderíamos transformar a variável Média de Pontos em uma variável dicotômica, classificando os jogadores com média acima de 15 como “bons marcadores” e aqueles com média inferior a 15 como “maus marcadores”:
Como visualizar variáveis dicotômicas
Normalmente visualizamos variáveis dicotômicas usando um gráfico de barras simples para representar as frequências de cada valor que elas podem assumir.
Por exemplo, o gráfico de barras a seguir mostra as frequências de cada gênero no conjunto de dados anterior:
Também poderíamos exibir frequências como porcentagens no eixo y:
Isso nos permite ver facilmente que 70% do total de atletas no conjunto de dados são homens e 30% são mulheres.
Como analisar variáveis dicotômicas
Existem várias maneiras de analisar variáveis dicotômicas. Dois dos métodos mais comuns incluem:
1. Teste z de uma proporção
Um teste z de uma proporção determina se uma proporção observada é ou não igual a uma proporção teórica.
Por exemplo, poderíamos utilizar este teste para determinar se a verdadeira proporção de atletas do sexo masculino numa determinada população é igual a 50%.
2. Correlação ponto-bisserial
A correlação ponto-bisserial é usada para medir a relação entre uma variável dicotômica e uma variável contínua.
Este tipo de correlação assume um valor entre -1 e 1 onde:
- -1 indica uma correlação perfeitamente negativa entre duas variáveis
- 0 indica nenhuma correlação entre duas variáveis
- 1 indica uma correlação perfeitamente positiva entre duas variáveis
Por exemplo, poderíamos calcular a correlação ponto-bisserial entre o género e a média de pontos por jogo para compreender até que ponto estas duas variáveis estão relacionadas.