Como encontrar o coeficiente de correlação de r2
Você pode encontrar o coeficiente de correlação entre duas variáveis calculando a raiz quadrada do valor R ao quadrado (R 2 ) de um modelo de regressão linear simples.
Coeficiente de correlação = √ R 2 do modelo de regressão linear simples
O sinal do coeficiente de inclinação no modelo de regressão informa se o coeficiente de correlação é positivo ou negativo.
Os exemplos a seguir mostram como encontrar o coeficiente de correlação a partir do valor R ao quadrado de um modelo de regressão na prática.
Nota : O valor R ao quadrado de um modelo de regressão também é chamado de coeficiente de determinação.
Exemplo 1: Encontrando o coeficiente de correlação de R 2 (quando a inclinação é positiva)
Suponha que ajustamos um modelo de regressão linear simples usando horas estudadas como variável preditora e notas em exames como variável resposta.
Suponha que recebamos a seguinte saída do modelo:
Equação de regressão ajustada : nota do exame = 65,55 + 2,78 (horas estudadas)
R-quadrado (R 2 ) do modelo de regressão : 0,7845
O valor R-quadrado do modelo nos diz qual porcentagem de variação nas notas dos exames pode ser explicada pelas horas estudadas.
Neste exemplo, podemos perceber que as horas estudadas conseguem explicar 78,45% da variação nas notas dos exames.
Para encontrar o coeficiente de correlação entre horas estudadas e resultados de exames, podemos tirar a raiz quadrada de R 2 :
Coeficiente de correlação = √ R 2 = √ 0,7845 = 0,8857
Sendo o sinal positivo para as horas estudadas na equação de regressão, esse coeficiente de correlação é positivo.
Assim, o coeficiente de correlação entre horas estudadas e nota no exame é de 0,8857 .
Exemplo 2: Encontrando o coeficiente de correlação de R 2 (quando a inclinação é negativa)
Suponha que ajustamos um modelo de regressão linear simples usando a idade (em anos) como variável preditora e o supino máximo (em libras) como variável resposta.
Suponha que recebamos a seguinte saída do modelo:
Equação de regressão ajustada : supino máximo = 240,11 – 1,24 (idade)
R ao quadrado (R 2 ) do modelo de regressão : 0,4773
O valor R-quadrado do modelo nos diz qual porcentagem de variação no pico de libras no supino pode ser explicada pela idade.
Neste exemplo, podemos perceber que a idade é capaz de explicar 47,73% da variação da quantidade máxima de supino reto.
Para encontrar o coeficiente de correlação entre a idade e o supino máximo, podemos tirar a raiz quadrada de R 2 :
Coeficiente de correlação = √ R 2 = √ 0,4773 = 0,6909
Como o sinal da idade é negativo na equação de regressão, este coeficiente de correlação é negativo.
Assim, o coeficiente de correlação entre a idade e o supino máximo é de -0,6909 .
Recursos adicionais
Os tutoriais a seguir fornecem informações adicionais sobre coeficientes de correlação:
O que é considerado uma correlação “forte”?
Quando você deve usar correlação?
Como realizar um teste t de correlação