Excel: como interpretar valores p na saída de regressão


A regressão linear múltipla é usada para quantificar a relação entre duas ou mais variáveis preditoras e uma variável de resposta .

Sempre que realizamos regressão linear múltipla, estamos sempre interessados nos valores p do resultado para determinar se a relação entre as variáveis preditoras e a variável resposta é estatisticamente significativa.

Este tutorial explica como interpretar valores p na saída de um modelo de regressão linear múltipla no Excel.

Exemplo: Interpretando Valores P na Saída de Regressão no Excel

Suponha que queiramos saber se o número de horas de estudo e o número de exames preparatórios realizados afetam a nota que um aluno obtém em determinado vestibular.

Para explorar essa relação, podemos realizar uma regressão linear múltipla usando horas estudadas e exames preparatórios tomados como variáveis preditoras e notas de exames como variável resposta.

A captura de tela a seguir mostra a saída de regressão deste modelo no Excel:

Saída de regressão linear múltipla no Excel

Existem três valores de p que devemos observar no resultado:

  • Valor P do modelo geral
  • Valor P da primeira variável preditora (horas)
  • Valor de p da segunda variável preditora (exames preparatórios)

Veja como interpretar cada valor p:

Valor P do modelo geral

O valor p para o modelo geral pode ser encontrado na coluna denominada F Significância no resultado.

Podemos ver que esse valor p é 0,00 .

Dado que este valor é inferior a 0,05, podemos concluir que o modelo de regressão como um todo é estatisticamente significativo.

Ou seja, a soma das horas estudadas e dos exames preparatórios realizados tem uma relação estatisticamente significativa com a nota do exame final.

Valor P da primeira variável preditora (horas)

O valor p para a primeira variável preditora, horas, é 0,00.

Dado que este valor é inferior a 0,05, podemos concluir que as horas estudadas são estatisticamente significativas.

Ou seja, o número de horas que um aluno estuda tem uma relação estatisticamente significativa com a nota do exame final.

Valor de p da segunda variável preditora (exames preparatórios)

O valor p da segunda variável preditora, exames preparatórios, é 0,52.

Dado que este valor não é inferior a 0,05, podemos concluir que o número de exames preparatórios realizados não é estatisticamente significativo.

Ou seja, o número de exames preparatórios que um aluno realiza não tem relação estatisticamente significativa com a nota obtida no exame final.

Como esta variável não é estatisticamente significativa, podemos decidir removê-la do modelo, pois não proporciona nenhuma melhoria significativa ao modelo geral.

Neste caso, poderíamos realizar uma regressão linear simples utilizando apenas as horas estudadas como variável preditora.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns no Excel:

Como realizar regressão linear simples no Excel
Como realizar regressão linear múltipla no Excel
Como realizar regressão polinomial no Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *