Como criar uma matriz de covariância no excel
A covariância é uma medida de como as mudanças em uma variável estão associadas às mudanças em uma segunda variável. Mais especificamente, é uma medida do grau em que duas variáveis estão linearmente associadas.
A fórmula para calcular a covariância entre duas variáveis, X e Y é:
COV( X , Y ) = Σ(x- x )(y- y ) / n
Uma matriz de covariância é uma matriz quadrada que mostra a covariância entre muitas variáveis diferentes. Esta pode ser uma maneira simples e útil de entender como diferentes variáveis estão relacionadas em um conjunto de dados.
O exemplo a seguir mostra como criar uma matriz de covariância no Excel usando um conjunto de dados simples.
Como criar uma matriz de covariância no Excel
Digamos que temos o seguinte conjunto de dados que mostra as pontuações dos testes de 10 alunos diferentes em três disciplinas: matemática, ciências e história.
Para criar uma matriz de covariância para este conjunto de dados, clique na opção Análise de Dados no canto superior direito do Excel, na guia Dados .
Nota: Se você não vir a opção Análise de Dados, deverá primeiro carregar o Data Analysis Toolpak .
Ao clicar nesta opção, uma nova janela aparecerá. Clique em Covariância .
Na caixa Intervalo de entrada , digite “$A$1:$C$11” porque este é o intervalo de células onde nosso conjunto de dados está localizado. Marque a caixa Rótulos na primeira linha para informar ao Excel que os rótulos de nossas variáveis estão na primeira linha. Em seguida, na caixa Intervalo de saída , digite qualquer célula na qual deseja que a matriz de covariância apareça. Acho que a célula $E$2. Em seguida, clique em OK .
A matriz de covariância é gerada automaticamente e aparece na célula $E$2:
Como interpretar uma matriz de covariância
Depois de termos uma matriz de covariância, é bastante simples interpretar os valores da matriz.
Os valores ao longo das diagonais da matriz são simplesmente as variâncias de cada assunto. Por exemplo:
- A variação das pontuações em matemática é 64,96
- A variação das pontuações em ciências é 56,4
- A variação histórica da pontuação é 75,56
Os demais valores da matriz representam as covariâncias entre os diferentes assuntos. Por exemplo:
- A covariância entre as pontuações em matemática e ciências é 33,2.
- A covariância entre as pontuações em matemática e história é -24,44.
- A covariância entre as pontuações de ciência e história é -24,1.
Um número positivo para covariância indica que duas variáveis tendem a aumentar ou diminuir em conjunto. Por exemplo, matemática e ciências têm uma covariância positiva (33,2), indicando que os alunos com notas altas em matemática também tendem a ter notas altas em ciências. Da mesma forma, os alunos com mau desempenho em matemática também tendem a ter mau desempenho em ciências.
Um número negativo para covariância indica que à medida que uma variável aumenta, uma segunda variável tende a diminuir. Por exemplo, matemática e história têm uma covariância negativa (-24,44), indicando que os alunos com notas altas em matemática tendem a ter notas baixas em história. Da mesma forma, os alunos com notas baixas em matemática tendem a ter notas altas em história.