Uma rápida introdução à análise bivariada


O termo análise bivariada refere-se à análise de duas variáveis. Você pode se lembrar disso porque o prefixo “bi” significa “dois”.

O objetivo da análise bivariada é compreender a relação entre duas variáveis. Você pode comparar esse tipo de análise com o seguinte:

  • Análise univariada : A análise de uma variável.
  • Análise multivariada: análise de duas ou mais variáveis.

Existem três maneiras comuns de realizar análise bivariada:

1. Gráficos de dispersão.

2. Coeficientes de correlação.

3. Regressão linear simples.

Este tutorial fornece um exemplo de cada um desses tipos de análise bivariada usando o seguinte conjunto de dados que contém informações sobre duas variáveis: (1) Horas gastas estudando e (2) Notas em exames obtidas por 20 alunos diferentes:

1. Nuvens de pontos

Um gráfico de dispersão fornece uma maneira visual de realizar análises bivariadas. Permite-nos visualizar a relação entre duas variáveis, colocando o valor de uma variável no eixo x e o valor da outra variável no eixo y.

No gráfico de dispersão abaixo, colocamos as horas estudadas no eixo x e os resultados dos exames no eixo y:

Análise bivariada com gráfico de dispersão

Podemos perceber claramente que existe uma relação positiva entre as duas variáveis: à medida que aumenta o número de horas de estudo, as notas nos exames também tendem a aumentar.

2. Coeficientes de correlação

Um coeficiente de correlação fornece outra maneira de realizar análises bivariadas. O tipo mais comum de coeficiente de correlação é o coeficiente de correlação de Pearson , que é uma medida da associação linear entre duas variáveis.   Tem um valor entre -1 e 1 onde:

  • -1 indica uma correlação linear perfeitamente negativa entre duas variáveis
  • 0 indica nenhuma correlação linear entre duas variáveis
  • 1 indica uma correlação linear perfeitamente positiva entre duas variáveis

Essa métrica simples nos dá uma boa ideia de como duas variáveis estão relacionadas. Na prática, costumamos usar gráficos de dispersão e coeficientes de correlação para compreender a relação entre duas variáveis, para que possamos visualizar e quantificar sua relação.

3. Regressão linear simples

Uma terceira forma de realizar análise bivariada é utilizar regressão linear simples .

Usando este método, escolhemos uma variável como variável explicativa e a outra variável como variável de resposta . Em seguida, encontramos a linha que melhor “se ajusta” ao conjunto de dados, que podemos usar para entender a relação exata entre as duas variáveis.

Por exemplo, a linha mais adequada para o conjunto de dados acima é:

Nota do exame = 69,07 + 3,85*(horas estudadas)

Isso significa que cada hora adicional estudada está associada a um aumento médio na pontuação do exame de 3,85. Ao ajustar este modelo de regressão linear, podemos quantificar a relação exata entre as horas estudadas e a nota do exame.

Relacionado: Como realizar regressão linear simples no Excel

Conclusão

A análise bivariada é um dos tipos de análise mais comumente usados em estatística porque muitas vezes queremos entender a relação entre duas variáveis.

Usando gráficos de dispersão, coeficientes de correlação e regressão linear simples, podemos visualizar e quantificar a relação entre duas variáveis.

Freqüentemente, esses três métodos são usados juntos em uma análise para obter uma imagem completa da relação entre duas variáveis. Portanto, é uma boa ideia se familiarizar com cada método.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *