Jak obliczyć przedział ufności dla nachylenia regresji


Prostą regresję liniową stosuje się do ilościowego określenia związku między zmienną predykcyjną a zmienną odpowiedzi.

Metoda ta znajduje wiersz, który najlepiej „pasuje” do zbioru danych i przyjmuje następującą postać:

ŷ = b 0 + b 1 x

Złoto:

  • ŷ : Szacowana wartość odpowiedzi
  • b 0 : Początek linii regresji
  • b 1 : Nachylenie linii regresji
  • x : Wartość zmiennej predykcyjnej

Często interesuje nas wartość b 1 , która mówi nam o średniej zmianiezmiennej odpowiedzi związanej ze wzrostem o jedną jednostkę zmiennej predykcyjnej.

Możemy użyć poniższego wzoru do obliczenia przedziału ufności dla wartości β 1 , czyli wartości nachylenia dla całej populacji:

Przedział ufności dla β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

Złoto:

  •   b 1 = Współczynnik nachylenia pokazany w tabeli regresji
  • t 1-∝/2, n-2 = Krytyczna wartość t dla poziomu ufności 1-∝ z n-2 stopniami swobody, gdzie n jest całkowitą liczbą obserwacji w naszym zbiorze danych
  • se(b 1 ) = Błąd standardowy b 1 pokazany w tabeli regresji

Poniższy przykład pokazuje, jak w praktyce obliczyć przedział ufności dla nachylenia regresji.

Przykład: Przedział ufności dla nachylenia regresji

Załóżmy, że chcemy dopasować prosty model regresji liniowej, wykorzystując przestudiowane godziny jako zmienną predykcyjną i wyniki egzaminów jako zmienną odpowiedzi dla 15 uczniów w określonej klasie:

Możemy wykonać prostą regresję liniową w Excelu i otrzymać następujący wynik:

Korzystając z oszacowań współczynników w wyniku, możemy napisać dopasowany prosty model regresji liniowej w następujący sposób:

Wynik = 65,334 + 1,982*(Godziny nauki)

Wartość nachylenia regresji wynosi 1,982 .

To mówi nam, że każda dodatkowa godzina spędzona na nauce wiąże się ze średnim wzrostem wyniku egzaminu o 1982 .

Możemy użyć następującego wzoru do obliczenia 95% przedziału ufności dla nachylenia:

  • 95% CI dla β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • 95% CI dla β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • 95% CI dla β 1 : 1,982 ± 2,1604 * 0,248
  • 95% CI dla β 1 : [1,446, 2,518]

95% przedział ufności dla nachylenia regresji wynosi [1,446, 2,518] .

Ponieważ ten przedział ufności nie zawiera wartości 0, możemy stwierdzić, że istnieje statystycznie istotny związek pomiędzy przepracowanymi godzinami a oceną z egzaminu.

Uwaga : Użyliśmy kalkulatora odwrotnego rozkładu t, aby znaleźć krytyczną wartość t, która odpowiada 95% poziomowi ufności z 13 stopniami swobody.

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat regresji liniowej:

Wprowadzenie do prostej regresji liniowej
Wprowadzenie do wielokrotnej regresji liniowej
Jak czytać i interpretować tabelę regresji
Jak raportować wyniki regresji

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *