Hoe de coeftest()-functie in r te gebruiken
U kunt de functie coeftest() uit het lmtest- pakket in R gebruiken om een t-test uit te voeren voor elke geschatte coëfficiënt in een regressiemodel.
Deze functie gebruikt de volgende basissyntaxis:
coeftest(x)
Goud:
- x : Naam van het gepaste regressiemodel
Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld: hoe u de functie coeftest() in R gebruikt
Stel dat we het volgende gegevensframe in R hebben dat het aantal uren aan studeren toont, het aantal afgelegde oefenexamens en de eindexamenscore van 10 studenten in een klas:
#create data frame df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94), hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3), prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4)) #view data frame df score hours prac_exams 1 77 1 2 2 79 1 3 3 84 2 3 4 85 3 2 5 88 2 4 6 99 4 5 7 95 4 4 8 90 2 3 9 92 3 5 10 94 3 4
Stel nu dat we het volgende meervoudige lineaire regressiemodel in R willen passen:
Examenscore = β 0 + β 1 (uren) + β 2 (praktijkexamens)
We kunnen de functie lm() gebruiken om dit model aan te passen:
#fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)
We kunnen dan de functie coeftest() gebruiken om een t-test uit te voeren voor elke aangepaste regressiecoëfficiënt in het model:
library (lmtest)
#perform t-test for each coefficient in model
coeftest(fit)
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 68.40294 2.87227 23.8150 5.851e-08 ***
hours 4.19118 0.99612 4.2075 0.003998 **
prac_exams 2.69118 0.99612 2.7017 0.030566 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De t-teststatistiek en de bijbehorende p-waarde worden voor elke t-test weergegeven:
- Snijpunt : t = 23,8150, p = <0,000
- uur : t = 4,2075, p = 0,003998
- praktijkexamens : t = 2,7017, p = 0,030566
Merk op dat we voor elke t-toets de volgende nul- en alternatieve hypothesen gebruiken:
- H 0 : β i = 0 (de helling is gelijk aan nul)
- H A : β i ≠ 0 (de helling is niet gelijk aan nul)
Als de p-waarde van de t-toets onder een bepaalde drempel ligt (bijvoorbeeld α = 0,05), dan verwerpen we de nulhypothese en concluderen we dat er een statistisch significante relatie bestaat tussen de voorspellende variabele en de responsvariabele.
Omdat de p-waarde voor elke t-toets kleiner is dan 0,05, zouden we kunnen concluderen dat elke voorspellende variabele in het model een statistisch significante relatie heeft met de responsvariabele.
In de context van dit voorbeeld zouden we zeggen dat de uren die aan studeren worden besteed en het aantal afgelegde oefenexamens beide statistisch significante voorspellers zijn van het eindexamencijfer van studenten.
Aanvullende bronnen
De volgende zelfstudies bieden aanvullende informatie over lineaire regressie in R:
Hoe regressie-uitvoer in R te interpreteren
Hoe eenvoudige lineaire regressie uit te voeren in R
Hoe meervoudige lineaire regressie uit te voeren in R
Hoe logistische regressie uit te voeren in R