So verwenden sie die funktion coeftest() in r


Sie können die Funktion coeftest() aus dem lmtest- Paket in R verwenden, um einen t-Test für jeden geschätzten Koeffizienten in einem Regressionsmodell durchzuführen.

Diese Funktion verwendet die folgende grundlegende Syntax:

koeftest(x)

Gold:

  • x : Name des angepassten Regressionsmodells

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Verwendung der Funktion coeftest() in R

Angenommen, wir haben den folgenden Datenrahmen in R, der die Anzahl der Lernstunden, die Anzahl der abgelegten Übungsprüfungen und die Abschlussprüfungsnote von 10 Schülern einer Klasse anzeigt:

 #create data frame
df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94),
                 hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3),
                 prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4))

#view data frame
df

   score hours prac_exams
1 77 1 2
2 79 1 3
3 84 2 3
4 85 3 2
5 88 2 4
6 99 4 5
7 95 4 4
8 90 2 3
9 92 3 5
10 94 3 4

Nehmen wir nun an, wir möchten das folgende multiple lineare Regressionsmodell in R anpassen:

Prüfungsergebnis = β 0 + β 1 (Stunden) + β 2 (praktische Prüfungen)

Wir können die Funktion lm() verwenden, um dieses Modell anzupassen:

 #fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)

Anschließend können wir mit der Funktion coeftest() einen t-Test für jeden angepassten Regressionskoeffizienten im Modell durchführen:

 library (lmtest)

#perform t-test for each coefficient in model
coeftest(fit)

t test of coefficients:

            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 68.40294 2.87227 23.8150 5.851e-08 ***
hours 4.19118 0.99612 4.2075 0.003998 ** 
prac_exams 2.69118 0.99612 2.7017 0.030566 *  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Für jeden T-Test werden die T-Test-Statistik und der entsprechende p-Wert angezeigt:

  • Achsenabschnitt : t = 23,8150, p = <0,000
  • Stunden : t = 4,2075, p = 0,003998
  • prac_exams : t = 2,7017, p = 0,030566

Beachten Sie, dass wir für jeden t-Test die folgenden Null- und Alternativhypothesen verwenden:

  • H 0 : β i = 0 (die Steigung ist gleich Null)
  • H A : β i ≠ 0 (die Steigung ist ungleich Null)

Wenn der p-Wert des t-Tests unter einem bestimmten Schwellenwert liegt (z. B. α = 0,05), lehnen wir die Nullhypothese ab und kommen zu dem Schluss, dass eine statistisch signifikante Beziehung zwischen der Prädiktorvariablen und der Antwortvariablen besteht.

Da der p-Wert für jeden t-Test kleiner als 0,05 ist, würden wir daraus schließen, dass jede Prädiktorvariable im Modell eine statistisch signifikante Beziehung zur Antwortvariablen hat.

Im Kontext dieses Beispiels würden wir sagen, dass sowohl die Lernstunden als auch die Anzahl der abgelegten Übungsprüfungen statistisch signifikante Prädiktoren für die Abschlussprüfungsnote der Studierenden sind.

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zur linearen Regression in R:

So interpretieren Sie die Regressionsausgabe in R
So führen Sie eine einfache lineare Regression in R durch
So führen Sie eine multiple lineare Regression in R durch
So führen Sie eine logistische Regression in R durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert