Como realizar um teste t para a inclinação da linha de regressão em r
Realizamos uma regressão linear simples e obtemos a seguinte equação de regressão estimada:
ŷ=b 0 + b 1 x
Geralmente queremos saber se o coeficiente de inclinação, b 1 , é estatisticamente significativo.
Para determinar se b 1 é estatisticamente significativo, podemos realizar um teste t com a seguinte estatística de teste:
t = b 1 / se(b 1 )
Ouro:
- se(b 1 ) representa o erro padrão de b 1 .
Podemos então calcular o valor p que corresponde a esta estatística de teste com n-2 graus de liberdade.
Se o valor p for inferior a um determinado limite (por exemplo, α = 0,05), então podemos concluir que o coeficiente de inclinação é diferente de zero.
Em outras palavras, existe uma relação estatisticamente significativa entre a variável preditora e a variável resposta no modelo.
O exemplo a seguir mostra como realizar um teste t para a inclinação de uma linha de regressão em R.
Exemplo: Executando um teste t para a inclinação da linha de regressão em R
Suponha que temos o seguinte quadro de dados em R que contém informações sobre as horas estudadas e as notas dos exames finais obtidas por 12 alunos em uma turma:
#create data frame df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8), score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82)) #view data frame df hours score 1 1 65 2 1 67 3 2 78 4 2 75 5 3 73 6 4 84 7 5 80 8 5 76 9 5 89 10 6 91 11 6 83 12 8 82
Digamos que queremos ajustar um modelo de regressão linear simples para determinar se existe uma relação estatisticamente significativa entre as horas estudadas e as notas nos exames.
Podemos usar a função lm() em R para ajustar este modelo de regressão:
#fit simple linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -7,398 -3,926 -1,139 4,972 7,713 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 67.7685 3.3757 20.075 2.07e-09 *** hours 2.7037 0.7456 3.626 0.00464 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.479 on 10 degrees of freedom Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641
A partir dos resultados do modelo, podemos ver que a equação de regressão estimada é:
Nota do exame = 67,7685 + 2,7037 (horas)
Para testar se o coeficiente de inclinação é estatisticamente significativo, podemos calcular a estatística do teste t da seguinte forma:
- t = b 1 / se(b 1 )
- t = 2,7037 / 0,7456
- t = 3,626
O valor p que corresponde a esta estatística do teste t é exibido na coluna chamada Pr(> |t|) na saída.
O valor p acaba sendo 0,00464 .
Como este valor p é inferior a 0,05, concluímos que o coeficiente de inclinação é estatisticamente significativo.
Ou seja, existe uma relação estatisticamente significativa entre o número de horas estudadas e a nota final que o aluno obteve no exame.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como realizar regressão linear simples em R
Como realizar regressão linear múltipla em R
Como interpretar a saída da regressão em R