R múltiplo ou r quadrado: qual a diferença?
Ao ajustar um modelo de regressão usando a maioria dos softwares estatísticos, você frequentemente notará os dois valores a seguir no resultado:
R múltiplo: coeficiente de correlação múltipla entre três ou mais variáveis.
R-Quadrado: É calculado como (Múltiplo R) 2 e representa a proporção da variância na variável resposta de um modelo de regressão que pode ser explicada pelas variáveis preditoras. Este valor varia de 0 a 1.
Na prática, muitas vezes estamos interessados no valor de R ao quadrado porque ele nos diz quão úteis são as variáveis preditoras na previsão do valor da variável resposta.
No entanto, cada vez que adicionamos uma nova variável preditora ao modelo, é garantido que o R-quadrado aumentará mesmo que a variável preditora não seja útil.
R-quadrado ajustado é uma versão modificada do R-quadrado que se ajusta ao número de preditores em um modelo de regressão. É calculado da seguinte forma:
R 2 ajustado = 1 – [(1-R 2 )*(n-1)/(nk-1)]
Ouro:
- R 2 : O R 2 do modelo
- n : O número de observações
- k : O número de variáveis preditoras
Como o R-quadrado sempre aumenta à medida que você adiciona mais preditores a um modelo, o R-quadrado ajustado pode servir como uma métrica que informa o quão útil é um modelo, ajustado com base no número de preditores em um modelo .
Para entender melhor cada um desses termos, considere o exemplo a seguir.
Exemplo: R múltiplo, R ao quadrado e R ao quadrado ajustado
Suponha que temos o seguinte conjunto de dados que contém as três variáveis a seguir para 12 alunos diferentes:
Suponha que ajustemos um modelo de regressão linear múltipla usando horas de estudo e nota atual como variáveis preditoras e pontuação no exame como variável de resposta e obtemos o seguinte resultado:
Podemos observar os valores das três métricas a seguir:
Múltiplo R: 0,978 . Isso representa a correlação múltipla entre a variável resposta e as duas variáveis preditoras.
R Quadrado: 0,956 . Isso é calculado como (Múltiplo R) 2 = (0,978) 2 = 0,956. Isso nos diz que 95,6% da variação nas notas dos exames pode ser explicada pela quantidade de horas que os alunos passaram estudando e pela nota atual no curso.
R-quadrado ajustado: 0,946 . Isso é calculado da seguinte forma:
R 2 ajustado = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-0,956)*(12-1)/(12-2-1) ] = 0,946.
Isso representa o valor de R ao quadrado, ajustado para o número de variáveis preditoras no modelo .
Esta medida seria útil se, por exemplo, ajustássemos outro modelo de regressão com 10 preditores e descobríssemos que o R-quadrado ajustado desse modelo era 0,88 . Isso indicaria que o modelo de regressão com apenas dois preditores é melhor porque possui um valor de R quadrado ajustado mais alto.
Recursos adicionais
Introdução à regressão linear múltipla
O que é um bom valor de R ao quadrado?