Como calcular a correlação parcial no excel


Nas estatísticas, costumamos usar o coeficiente de correlação de Pearson para medir a relação linear entre duas variáveis. Porém, às vezes queremos entender a relação entre duas variáveis enquanto controlamos uma terceira variável .

Por exemplo, suponha que queiramos medir a associação entre o número de horas de estudo de um aluno e a nota do exame final, controlando a nota atual do aluno na turma. Neste caso, poderíamos utilizar a correlação parcial para medir a relação entre as horas estudadas e a nota do exame final.

Este tutorial explica como calcular uma correlação parcial no Excel.

Exemplo: correlação parcial no Excel

Digamos que temos um conjunto de dados que exibe as seguintes informações para 10 alunos:

  • Nota atual em uma turma
  • Horas gastas estudando para o exame final
  • Nota do exame final

Use as etapas a seguir para encontrar a correlação parcial entre as horas estudadas e a nota do exame enquanto controla a nota atual.

Etapa 1: Calcule cada correlação de pares.

Primeiro, calcularemos a correlação entre cada combinação de variáveis aos pares:

Etapa 2: Calcule a correlação parcial entre horas e nota do exame.

A fórmula para calcular a correlação parcial entre a variável A e a variável B enquanto controla a variável C é a seguinte:

Correlação parcial = (r A,B – r A,C *r B,C ) / √((1-r 2 A,B )(1-r 2 B,C ))

A captura de tela a seguir mostra como usar esta fórmula para calcular a correlação parcial entre horas e nota do exame, controlando a nota atual:

Como calcular a correlação parcial no Excel

A correlação parcial é 0,190626 . Para determinar se esta correlação é estatisticamente significativa, podemos encontrar o valor p correspondente.

Etapa 3: Calcule o valor p da correlação parcial.

A estatística do teste t pode ser calculada da seguinte forma:

t = r√(n-3) / √(1-r 2 )

A captura de tela a seguir mostra como usar esta fórmula para calcular a estatística de teste e o valor p correspondente:

Teste de correlação parcial para significância no Excel

A estatística do teste t é 0,51377 . O número total de graus de liberdade é n-3 = 10-3 = 7 . O valor p correspondente é 0,623228 . Dado que este valor não é inferior a 0,05, significa que a correlação parcial entre horas e resultados de exames não é estatisticamente significativa.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *