Como criar uma matriz de covariância no excel


A covariância é uma medida de como as mudanças em uma variável estão associadas às mudanças em uma segunda variável. Mais especificamente, é uma medida do grau em que duas variáveis estão linearmente associadas.

A fórmula para calcular a covariância entre duas variáveis, X e Y é:

COV( X , Y ) = Σ(x- x )(y- y ) / n

Uma matriz de covariância é uma matriz quadrada que mostra a covariância entre muitas variáveis diferentes. Esta pode ser uma maneira simples e útil de entender como diferentes variáveis estão relacionadas em um conjunto de dados.

O exemplo a seguir mostra como criar uma matriz de covariância no Excel usando um conjunto de dados simples.

Como criar uma matriz de covariância no Excel

Digamos que temos o seguinte conjunto de dados que mostra as pontuações dos testes de 10 alunos diferentes em três disciplinas: matemática, ciências e história.

Para criar uma matriz de covariância para este conjunto de dados, clique na opção Análise de Dados no canto superior direito do Excel, na guia Dados .

Conjunto de ferramentas de análise no Excel

Nota: Se você não vir a opção Análise de Dados, deverá primeiro carregar o Data Analysis Toolpak .

Ao clicar nesta opção, uma nova janela aparecerá. Clique em Covariância .

Na caixa Intervalo de entrada , digite “$A$1:$C$11” porque este é o intervalo de células onde nosso conjunto de dados está localizado. Marque a caixa Rótulos na primeira linha para informar ao Excel que os rótulos de nossas variáveis estão na primeira linha. Em seguida, na caixa Intervalo de saída , digite qualquer célula na qual deseja que a matriz de covariância apareça. Acho que a célula $E$2. Em seguida, clique em OK .

A matriz de covariância é gerada automaticamente e aparece na célula $E$2:

Como interpretar uma matriz de covariância

Depois de termos uma matriz de covariância, é bastante simples interpretar os valores da matriz.

Os valores ao longo das diagonais da matriz são simplesmente as variâncias de cada assunto. Por exemplo:

  • A variação das pontuações em matemática é 64,96
  • A variação das pontuações em ciências é 56,4
  • A variação histórica da pontuação é 75,56

Os demais valores da matriz representam as covariâncias entre os diferentes assuntos. Por exemplo:

  • A covariância entre as pontuações em matemática e ciências é 33,2.
  • A covariância entre as pontuações em matemática e história é -24,44.
  • A covariância entre as pontuações de ciência e história é -24,1.

Um número positivo para covariância indica que duas variáveis tendem a aumentar ou diminuir em conjunto. Por exemplo, matemática e ciências têm uma covariância positiva (33,2), indicando que os alunos com notas altas em matemática também tendem a ter notas altas em ciências. Da mesma forma, os alunos com mau desempenho em matemática também tendem a ter mau desempenho em ciências.

Um número negativo para covariância indica que à medida que uma variável aumenta, uma segunda variável tende a diminuir. Por exemplo, matemática e história têm uma covariância negativa (-24,44), indicando que os alunos com notas altas em matemática tendem a ter notas baixas em história. Da mesma forma, os alunos com notas baixas em matemática tendem a ter notas altas em história.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *