Uma rápida introdução à análise bivariada
O termo análise bivariada refere-se à análise de duas variáveis. Você pode se lembrar disso porque o prefixo “bi” significa “dois”.
O objetivo da análise bivariada é compreender a relação entre duas variáveis. Você pode comparar esse tipo de análise com o seguinte:
- Análise univariada : A análise de uma variável.
- Análise multivariada: análise de duas ou mais variáveis.
Existem três maneiras comuns de realizar análise bivariada:
1. Gráficos de dispersão.
2. Coeficientes de correlação.
3. Regressão linear simples.
Este tutorial fornece um exemplo de cada um desses tipos de análise bivariada usando o seguinte conjunto de dados que contém informações sobre duas variáveis: (1) Horas gastas estudando e (2) Notas em exames obtidas por 20 alunos diferentes:
1. Nuvens de pontos
Um gráfico de dispersão fornece uma maneira visual de realizar análises bivariadas. Permite-nos visualizar a relação entre duas variáveis, colocando o valor de uma variável no eixo x e o valor da outra variável no eixo y.
No gráfico de dispersão abaixo, colocamos as horas estudadas no eixo x e os resultados dos exames no eixo y:
Podemos perceber claramente que existe uma relação positiva entre as duas variáveis: à medida que aumenta o número de horas de estudo, as notas nos exames também tendem a aumentar.
2. Coeficientes de correlação
Um coeficiente de correlação fornece outra maneira de realizar análises bivariadas. O tipo mais comum de coeficiente de correlação é o coeficiente de correlação de Pearson , que é uma medida da associação linear entre duas variáveis. Tem um valor entre -1 e 1 onde:
- -1 indica uma correlação linear perfeitamente negativa entre duas variáveis
- 0 indica nenhuma correlação linear entre duas variáveis
- 1 indica uma correlação linear perfeitamente positiva entre duas variáveis
Essa métrica simples nos dá uma boa ideia de como duas variáveis estão relacionadas. Na prática, costumamos usar gráficos de dispersão e coeficientes de correlação para compreender a relação entre duas variáveis, para que possamos visualizar e quantificar sua relação.
3. Regressão linear simples
Uma terceira forma de realizar análise bivariada é utilizar regressão linear simples .
Usando este método, escolhemos uma variável como variável explicativa e a outra variável como variável de resposta . Em seguida, encontramos a linha que melhor “se ajusta” ao conjunto de dados, que podemos usar para entender a relação exata entre as duas variáveis.
Por exemplo, a linha mais adequada para o conjunto de dados acima é:
Nota do exame = 69,07 + 3,85*(horas estudadas)
Isso significa que cada hora adicional estudada está associada a um aumento médio na pontuação do exame de 3,85. Ao ajustar este modelo de regressão linear, podemos quantificar a relação exata entre as horas estudadas e a nota do exame.
Relacionado: Como realizar regressão linear simples no Excel
Conclusão
A análise bivariada é um dos tipos de análise mais comumente usados em estatística porque muitas vezes queremos entender a relação entre duas variáveis.
Usando gráficos de dispersão, coeficientes de correlação e regressão linear simples, podemos visualizar e quantificar a relação entre duas variáveis.
Freqüentemente, esses três métodos são usados juntos em uma análise para obter uma imagem completa da relação entre duas variáveis. Portanto, é uma boa ideia se familiarizar com cada método.