Excel: como interpretar valores p na saída de regressão
A regressão linear múltipla é usada para quantificar a relação entre duas ou mais variáveis preditoras e uma variável de resposta .
Sempre que realizamos regressão linear múltipla, estamos sempre interessados nos valores p do resultado para determinar se a relação entre as variáveis preditoras e a variável resposta é estatisticamente significativa.
Este tutorial explica como interpretar valores p na saída de um modelo de regressão linear múltipla no Excel.
Exemplo: Interpretando Valores P na Saída de Regressão no Excel
Suponha que queiramos saber se o número de horas de estudo e o número de exames preparatórios realizados afetam a nota que um aluno obtém em determinado vestibular.
Para explorar essa relação, podemos realizar uma regressão linear múltipla usando horas estudadas e exames preparatórios tomados como variáveis preditoras e notas de exames como variável resposta.
A captura de tela a seguir mostra a saída de regressão deste modelo no Excel:
Existem três valores de p que devemos observar no resultado:
- Valor P do modelo geral
- Valor P da primeira variável preditora (horas)
- Valor de p da segunda variável preditora (exames preparatórios)
Veja como interpretar cada valor p:
Valor P do modelo geral
O valor p para o modelo geral pode ser encontrado na coluna denominada F Significância no resultado.
Podemos ver que esse valor p é 0,00 .
Dado que este valor é inferior a 0,05, podemos concluir que o modelo de regressão como um todo é estatisticamente significativo.
Ou seja, a soma das horas estudadas e dos exames preparatórios realizados tem uma relação estatisticamente significativa com a nota do exame final.
Valor P da primeira variável preditora (horas)
O valor p para a primeira variável preditora, horas, é 0,00.
Dado que este valor é inferior a 0,05, podemos concluir que as horas estudadas são estatisticamente significativas.
Ou seja, o número de horas que um aluno estuda tem uma relação estatisticamente significativa com a nota do exame final.
Valor de p da segunda variável preditora (exames preparatórios)
O valor p da segunda variável preditora, exames preparatórios, é 0,52.
Dado que este valor não é inferior a 0,05, podemos concluir que o número de exames preparatórios realizados não é estatisticamente significativo.
Ou seja, o número de exames preparatórios que um aluno realiza não tem relação estatisticamente significativa com a nota obtida no exame final.
Como esta variável não é estatisticamente significativa, podemos decidir removê-la do modelo, pois não proporciona nenhuma melhoria significativa ao modelo geral.
Neste caso, poderíamos realizar uma regressão linear simples utilizando apenas as horas estudadas como variável preditora.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns no Excel:
Como realizar regressão linear simples no Excel
Como realizar regressão linear múltipla no Excel
Como realizar regressão polinomial no Excel