Covariance.p vs covariance.s no excel: qual a diferença?
Nas estatísticas, a covariância é uma forma de medir como as mudanças em uma variável estão associadas às mudanças em outra variável.
Um valor de covariância positivo indica que um aumento em uma variável está associado a um aumento em outra variável.
Um valor negativo indica que um aumento em uma variável está associado a uma diminuição em outra variável.
Existem duas funções diferentes que você pode usar para calcular a covariância no Excel:
1. COVARIANCE.P: Esta função calcula a covariância populacional. Use esta função quando o intervalo de valores representar toda a população.
Esta função usa a seguinte fórmula:
Covariância populacional = Σ(x i – x )(y i – y ) / n
Ouro:
- Σ: Um símbolo grego que significa “soma”
- x i : O i- ésimo valor da variável x
- x : O valor médio da variável x
- y i : o i- ésimo valor da variável y
- y : O valor médio da variável y
- n: O número total de observações
2. COVARIANCE.S: Esta função calcula a covariância da amostra. Use esta função quando o intervalo de valores representar uma amostra de valores em vez de uma população inteira.
Esta função usa a seguinte fórmula:
Covariância da amostra = Σ(x i – x )(y i – y ) / (n-1)
Ouro:
- Σ: Um símbolo grego que significa “soma”
- x i : O i- ésimo valor da variável x
- x : O valor médio da variável x
- y i : o i- ésimo valor da variável y
- y : O valor médio da variável y
- n: O número total de observações
Observe a diferença sutil entre as duas fórmulas: COVARIANCE.P divide por n enquanto COVARIANCE.S divide por n-1 .
Por esse motivo, a fórmula COVARIANCE.S sempre produzirá um valor maior porque divide por um valor menor.
O exemplo a seguir mostra como usar cada fórmula na prática.
Exemplo: COVARIANCE.P vs COVARIANCE.S no Excel
Digamos que temos o seguinte conjunto de dados no Excel que mostra os pontos e assistências de 15 jogadores de basquete diferentes:
A captura de tela a seguir mostra como calcular a covariância entre pontos e assistências usando duas fórmulas de covariância diferentes:
A covariância da amostra é 15,69 e a covariância da população é 14,64 .
Conforme mencionado anteriormente, a covariância da amostra será sempre maior que a covariância da população.
Quando usar COVARIANCE.P ou COVARIANCE.S
Na maioria dos casos não conseguimos recolher dados de uma população inteira. Portanto, coletamos dados apenas para uma amostra da população.
Portanto, quase sempre usamos COVARIANCE.S para calcular a covariância de um conjunto de dados porque nosso conjunto de dados geralmente representa uma amostra.
Em casos raros em que seus dados representam uma população inteira, você pode usar a função COVARIANCE.P .
Recursos adicionais
Os tutoriais a seguir explicam a diferença entre outras funções do Excel comumente usadas:
STDEV.P vs STDEV.S no Excel: Qual é a diferença?
PERCENTILE.EXC vs PERCENTILE.INC no Excel: Qual é a diferença?
QUARTILE.EXC vs QUARTILE.INC no Excel: Qual é a diferença?