O que é uma covariável nas estatísticas?
Em estatística, os investigadores muitas vezes desejam compreender a relação entre uma ou mais variáveis explicativas e uma variável de resposta .
No entanto, pode acontecer que outras variáveis afetem a variável resposta e não sejam de interesse dos investigadores. Essas variáveis são chamadas de covariáveis .
Covariáveis: Variáveis que afetam uma variável de resposta, mas não são de interesse em um estudo.
Por exemplo, suponha que os pesquisadores queiram saber se três técnicas de estudo diferentes levam a pontuações médias diferentes em testes em uma determinada escola. A técnica de estudo é a variável explicativa e a nota do exame é a variável resposta.
No entanto, é provável que haja variações nas habilidades de estudo dos alunos dentro dos três grupos. Se isso não for levado em consideração, haverá uma variação inexplicável dentro do estudo e tornará mais difícil determinar a verdadeira relação entre a técnica do estudo e os resultados do exame.
Uma maneira de explicar isso seria usar a nota atual do aluno na turma como covariável . É bem sabido que a nota atual de um aluno provavelmente está correlacionada com seu desempenho em exames futuros.
Assim, embora a nota atual não seja uma variável de interesse neste estudo, ela pode ser incluída como uma covariável para que os pesquisadores possam verificar se a técnica de estudo afeta as notas dos exames, mesmo depois de contabilizada a nota atual do aluno na turma.
As covariáveis aparecem com mais frequência em dois tipos de contextos: ANOVA (análise de variância) e regressão.
Covariáveis na ANOVA
Quando realizamos uma ANOVA (seja uma ANOVA unidirecional , uma ANOVA bidirecional ou algo mais complexo), queremos saber se há ou não diferença entre as médias de três grupos independentes ou mais.
Em nosso exemplo anterior, queríamos entender se havia ou não diferença nas notas médias dos exames entre três técnicas de estudo diferentes. Para entender isso, poderíamos ter realizado uma ANOVA unidirecional.
No entanto, como sabíamos que a nota atual de um aluno provavelmente também afetaria as notas dos exames, poderíamos incluí-la como uma covariável e, em vez disso, realizar uma ANCOVA (análise de covariância).
Isso é semelhante a uma ANOVA, exceto que incluímos uma variável contínua (a nota atual do aluno) como covariável para que possamos entender se há ou não diferença nas notas médias dos exames entre as três técnicas de pontuação. estudar, mesmo depois de levar em conta os resultados do aluno. classificação atual .
Covariáveis na regressão
Quando realizamos regressão linear, queremos quantificar a relação entre uma ou mais variáveis explicativas e uma variável resposta.
Por exemplo, poderíamos realizar uma regressão linear simples para quantificar a relação entre a metragem quadrada e os preços dos imóveis em uma determinada cidade. Porém, sabe-se que a idade de uma casa também é uma variável que afeta o preço dos imóveis.
Em particular, as casas mais antigas podem estar correlacionadas com preços imobiliários mais baixos. Neste caso, a idade da casa seria uma covariável , uma vez que não estamos realmente interessados em estudá-la, mas sabemos que tem efeito nos preços das casas.
Assim, poderíamos incluir a idade da casa como variável explicativa e executar uma regressão linear múltipla com a metragem quadrada e a idade da casa como variáveis explicativas e o preço da casa como variável de resposta.
Portanto, o coeficiente de regressão para a metragem quadrada nos indicaria a variação média no preço da casa associada a um aumento de uma unidade na metragem quadrada , após contabilizar a idade da casa .
Recursos adicionais
Uma introdução à ANCOVA (análise de variância)
Como interpretar coeficientes de regressão
Como realizar uma ANCOVA no Excel
Como realizar regressão linear múltipla no Excel