Jak obliczyć przedział ufności dla nachylenia regresji
Prostą regresję liniową stosuje się do ilościowego określenia związku między zmienną predykcyjną a zmienną odpowiedzi.
Metoda ta znajduje wiersz, który najlepiej „pasuje” do zbioru danych i przyjmuje następującą postać:
ŷ = b 0 + b 1 x
Złoto:
- ŷ : Szacowana wartość odpowiedzi
- b 0 : Początek linii regresji
- b 1 : Nachylenie linii regresji
- x : Wartość zmiennej predykcyjnej
Często interesuje nas wartość b 1 , która mówi nam o średniej zmianiezmiennej odpowiedzi związanej ze wzrostem o jedną jednostkę zmiennej predykcyjnej.
Możemy użyć poniższego wzoru do obliczenia przedziału ufności dla wartości β 1 , czyli wartości nachylenia dla całej populacji:
Przedział ufności dla β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
Złoto:
- b 1 = Współczynnik nachylenia pokazany w tabeli regresji
- t 1-∝/2, n-2 = Krytyczna wartość t dla poziomu ufności 1-∝ z n-2 stopniami swobody, gdzie n jest całkowitą liczbą obserwacji w naszym zbiorze danych
- se(b 1 ) = Błąd standardowy b 1 pokazany w tabeli regresji
Poniższy przykład pokazuje, jak w praktyce obliczyć przedział ufności dla nachylenia regresji.
Przykład: Przedział ufności dla nachylenia regresji
Załóżmy, że chcemy dopasować prosty model regresji liniowej, wykorzystując przestudiowane godziny jako zmienną predykcyjną i wyniki egzaminów jako zmienną odpowiedzi dla 15 uczniów w określonej klasie:

Możemy wykonać prostą regresję liniową w Excelu i otrzymać następujący wynik:

Korzystając z oszacowań współczynników w wyniku, możemy napisać dopasowany prosty model regresji liniowej w następujący sposób:
Wynik = 65,334 + 1,982*(Godziny nauki)
Wartość nachylenia regresji wynosi 1,982 .
To mówi nam, że każda dodatkowa godzina spędzona na nauce wiąże się ze średnim wzrostem wyniku egzaminu o 1982 .
Możemy użyć następującego wzoru do obliczenia 95% przedziału ufności dla nachylenia:
- 95% CI dla β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
- 95% CI dla β 1 : 1,982 ± t 0,975, 15-2 * 0,248
- 95% CI dla β 1 : 1,982 ± 2,1604 * 0,248
- 95% CI dla β 1 : [1,446, 2,518]
95% przedział ufności dla nachylenia regresji wynosi [1,446, 2,518] .
Ponieważ ten przedział ufności nie zawiera wartości 0, możemy stwierdzić, że istnieje statystycznie istotny związek pomiędzy przepracowanymi godzinami a oceną z egzaminu.
Uwaga : Użyliśmy kalkulatora odwrotnego rozkładu t, aby znaleźć krytyczną wartość t, która odpowiada 95% poziomowi ufności z 13 stopniami swobody.
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat regresji liniowej:
Wprowadzenie do prostej regresji liniowej
Wprowadzenie do wielokrotnej regresji liniowej
Jak czytać i interpretować tabelę regresji
Jak raportować wyniki regresji