Excel: calcule o intervalo de confiança para o coeficiente de regressão
Num modelo de regressão linear, um coeficiente de regressão indica-nos a alteração média na variável de resposta associada a um aumento de uma unidade na variável preditora.
Podemos usar a seguinte fórmula para calcular um intervalo de confiança para um coeficiente de regressão:
Intervalo de confiança para β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
Ouro:
- b 1 = Coeficiente de regressão mostrado na tabela de regressão
- t 1-∝/2, n-2 = O valor t crítico para o nível de confiança 1-∝ com n-2 graus de liberdade, onde n é o número total de observações em nosso conjunto de dados
- se(b 1 ) = O erro padrão de b 1 mostrado na tabela de regressão
O exemplo a seguir mostra como calcular um intervalo de confiança para um coeficiente de regressão no Excel.
Exemplo: intervalo de confiança para coeficiente de regressão no Excel
Suponha que queiramos ajustar um modelo de regressão linear simples usando horas estudadas como variável preditora e notas em exames como variável resposta para 15 alunos em uma turma específica:
Podemos digitar a seguinte fórmula na célula D2 para realizar uma regressão linear simples usando os valores da coluna Horas como variável preditora e os valores da coluna Pontuação como variável de resposta:
=LINEST( B2:B16 , A2:A16 , TRUE, TRUE)
Observe que o primeiro argumento TRUE diz ao Excel para calcular a interceptação da equação de regressão normalmente, sem forçá-la a zero.
O segundo argumento TRUE diz ao Excel para produzir estatísticas de regressão adicionais além dos coeficientes.
A captura de tela a seguir mostra o resultado desta fórmula (explicamos o que cada valor de saída representa no texto em vermelho abaixo da saída):
Usando os coeficientes de regressão, podemos escrever a equação de regressão ajustada da seguinte forma:
Pontuação = 65,334 + 1,982*(Horas estudadas)
Observe que o coeficiente de regressão para horas é 1,982 .
Isso nos diz que cada hora adicional de estudo gasta está associada a um aumento médio de 1.982 na pontuação do exame.
Para calcular um intervalo de confiança de 95% para o coeficiente de regressão, podemos inserir as seguintes fórmulas nas células H2 e H3:
- H2: = D2 – T.INV.2T(0,05, E5)*D3
- H3: = D2 + T.INV.2T(0,05, E5)*D3
A captura de tela a seguir mostra como usar essas fórmulas na prática:
O intervalo de confiança de 95% para o coeficiente de regressão é [1,446, 2,518] .
Dado que este intervalo de confiança não contém o valor 0 , podemos concluir que existe uma associação estatisticamente significativa entre as horas estudadas e a nota do exame.
Também podemos confirmar que isto está correto calculando manualmente o intervalo de confiança de 95% para o coeficiente de regressão:
- IC de 95% para β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
- IC de 95% para β 1 : 1,982 ± t 0,975, 15-2 * 0,248
- IC 95% para β 1 : 1,982 ± 2,1604 * 0,248
- IC de 95% para β 1 : [1,446, 2,518]
O intervalo de confiança de 95% para o coeficiente de regressão é [1,446, 2,518] .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns no Excel:
Como realizar regressão linear simples no Excel
Como realizar regressão linear múltipla no Excel
Como interpretar valores P na saída de regressão no Excel