Como realizar um teste t para a inclinação da linha de regressão em r


Realizamos uma regressão linear simples e obtemos a seguinte equação de regressão estimada:

ŷ=b 0 + b 1 x

Geralmente queremos saber se o coeficiente de inclinação, b 1 , é estatisticamente significativo.

Para determinar se b 1 é estatisticamente significativo, podemos realizar um teste t com a seguinte estatística de teste:

t = b 1 / se(b 1 )

Ouro:

  • se(b 1 ) representa o erro padrão de b 1 .

Podemos então calcular o valor p que corresponde a esta estatística de teste com n-2 graus de liberdade.

Se o valor p for inferior a um determinado limite (por exemplo, α = 0,05), então podemos concluir que o coeficiente de inclinação é diferente de zero.

Em outras palavras, existe uma relação estatisticamente significativa entre a variável preditora e a variável resposta no modelo.

O exemplo a seguir mostra como realizar um teste t para a inclinação de uma linha de regressão em R.

Exemplo: Executando um teste t para a inclinação da linha de regressão em R

Suponha que temos o seguinte quadro de dados em R que contém informações sobre as horas estudadas e as notas dos exames finais obtidas por 12 alunos em uma turma:

 #create data frame
df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8),
                 score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82))

#view data frame
df

   hours score
1 1 65
2 1 67
3 2 78
4 2 75
5 3 73
6 4 84
7 5 80
8 5 76
9 5 89
10 6 91
11 6 83
12 8 82

Digamos que queremos ajustar um modelo de regressão linear simples para determinar se existe uma relação estatisticamente significativa entre as horas estudadas e as notas nos exames.

Podemos usar a função lm() em R para ajustar este modelo de regressão:

 #fit simple linear regression model
fit <- lm(score ~ hours, data=df)

#view model summary
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-7,398 -3,926 -1,139 4,972 7,713 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 67.7685 3.3757 20.075 2.07e-09 ***
hours 2.7037 0.7456 3.626 0.00464 ** 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.479 on 10 degrees of freedom
Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 
F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641

A partir dos resultados do modelo, podemos ver que a equação de regressão estimada é:

Nota do exame = 67,7685 + 2,7037 (horas)

Para testar se o coeficiente de inclinação é estatisticamente significativo, podemos calcular a estatística do teste t da seguinte forma:

  • t = b 1 / se(b 1 )
  • t = 2,7037 / 0,7456
  • t = 3,626

O valor p que corresponde a esta estatística do teste t é exibido na coluna chamada Pr(> |t|) na saída.

O valor p acaba sendo 0,00464 .

Como este valor p é inferior a 0,05, concluímos que o coeficiente de inclinação é estatisticamente significativo.

Ou seja, existe uma relação estatisticamente significativa entre o número de horas estudadas e a nota final que o aluno obteve no exame.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como realizar regressão linear simples em R
Como realizar regressão linear múltipla em R
Como interpretar a saída da regressão em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *