Jak obliczyć przedział ufności dla współczynnika regresji w r


W modelu regresji liniowej współczynnik regresji informuje nas o średniej zmianiezmiennej odpowiedzi powiązanej ze wzrostem o jedną jednostkę zmiennej predykcyjnej.

Do obliczenia przedziału ufności dla współczynnika regresji możemy użyć następującego wzoru:

Przedział ufności dla β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

Złoto:

  •   b 1 = współczynnik regresji pokazany w tabeli regresji
  • t 1-∝/2, n-2 = Krytyczna wartość t dla poziomu ufności 1-∝ z n-2 stopniami swobody, gdzie n jest całkowitą liczbą obserwacji w naszym zbiorze danych
  • se(b 1 ) = Błąd standardowy b 1 pokazany w tabeli regresji

Poniższy przykład pokazuje, jak w praktyce obliczyć przedział ufności dla nachylenia regresji.

Przykład: Przedział ufności dla współczynnika regresji w R

Załóżmy, że chcemy dopasować prosty model regresji liniowej, wykorzystując przestudiowane godziny jako zmienną predykcyjną i wyniki egzaminów jako zmienną odpowiedzi dla 15 uczniów w określonej klasie:

Możemy użyć funkcji lm() , aby dopasować ten prosty model regresji liniowej w R:

 #create data frame
df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14),
                 score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89))

#fit linear regression model
fit <- lm(score ~ hours, data=df)

#view model summary
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-5,140 -3,219 -1,193 2,816 5,772 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 65,334 2,106 31,023 1.41e-13 ***
hours 1.982 0.248 7.995 2.25e-06 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.641 on 13 degrees of freedom
Multiple R-squared: 0.831, Adjusted R-squared: 0.818 
F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06

Korzystając z oszacowań współczynników w wyniku, możemy napisać dopasowany prosty model regresji liniowej w następujący sposób:

Wynik = 65,334 + 1,982*(Godziny nauki)

Należy zauważyć, że współczynnik regresji dla godzin wynosi 1,982 .

To mówi nam, że każda dodatkowa godzina spędzona na nauce wiąże się ze średnim wzrostem wyniku egzaminu o 1982 .

Możemy użyć funkcji confint() do obliczenia 95% przedziału ufności dla współczynnika regresji:

 #calculate confidence interval for regression coefficient for 'hours'
confint(fit, ' hours ', level= 0.95 )

         2.5% 97.5%
hours 1.446682 2.518068

95% przedział ufności dla współczynnika regresji wynosi [1,446, 2,518] .

Ponieważ ten przedział ufności nie zawiera wartości 0, możemy stwierdzić, że istnieje statystycznie istotny związek pomiędzy przepracowanymi godzinami a oceną z egzaminu.

Możemy również potwierdzić, że jest to prawidłowe, ręcznie obliczając 95% przedział ufności dla współczynnika regresji:

  • 95% CI dla β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • 95% CI dla β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • 95% CI dla β 1 : 1,982 ± 2,1604 * 0,248
  • 95% CI dla β 1 : [1,446, 2,518]

95% przedział ufności dla współczynnika regresji wynosi [1,446, 2,518] .

Uwaga nr 1 : Użyliśmy kalkulatora odwrotnego rozkładu t, aby znaleźć krytyczną wartość t, która odpowiada 95% poziomowi ufności z 13 stopniami swobody.

Uwaga nr 2 : Aby obliczyć przedział ufności z innym poziomem ufności, wystarczy zmienić wartość argumentu poziomu w funkcji confint() .

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat regresji liniowej w języku R:

Jak interpretować wynik regresji w R
Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R
Jak przeprowadzić regresję logistyczną w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *