Jak skonstruować przedział przewidywania w programie excel


W statystyce prosta regresja liniowa jest techniką, którą możemy zastosować do ilościowego określenia związku między zmienną predykcyjną x i zmienną odpowiedzi y.

Kiedy przeprowadzamy prostą regresję liniową, otrzymujemy „linię najlepszego dopasowania”, która opisuje relację między x i y, co można zapisać jako:

ŷ = b 0 + b 1 x

Złoto:

  • ŷ jest przewidywaną wartością zmiennej odpowiedzi
  • b 0 jest punktem przecięcia z y
  • b 1 jest współczynnikiem regresji
  • x jest wartością zmiennej predykcyjnej

Czasami chcemy użyć tej linii najlepszego dopasowania do skonstruowania przedziału przewidywania dla danej wartości x 0 , który jest przedziałem wokół przewidywanej wartości × 0 takim, że istnieje 95% prawdopodobieństwo, że prawdziwa wartość y w populacji odpowiadający x 0 jest zawarty w tym przedziale.

Zapisuje się wzór na obliczenie przedziału predykcji dla danej wartości x 0 :

ŷ 0 +/- t α/2,df=n-2 * se

Złoto:

se = S yx √(1 + 1/n + (x 0x ) 2 /SS x )

Formuła może wydawać się nieco onieśmielająca, ale w rzeczywistości można ją łatwo obliczyć w programie Excel. Następnie zobaczymy przykład użycia tej formuły do obliczenia przedziału przewidywania dla danej wartości w programie Excel.

Przykład: Jak skonstruować przedział przewidywania w programie Excel

Poniższy zbiór danych przedstawia liczbę godzin nauki oraz wynik egzaminu uzyskany przez 15 różnych uczniów:

Przykładowy zbiór danych w programie Excel

Załóżmy, że chcemy utworzyć 95% przedział przewidywań dla wartości x 0 = 3. Oznacza to, że chcemy utworzyć taki przedział, aby istniało 95% prawdopodobieństwo, że wynik egzaminu będzie mieścić się w tym przedziale dla studenta studiującego 3 godziny.

Poniższy zrzut ekranu pokazuje, jak obliczyć wszystkie wartości potrzebne do uzyskania tego przedziału predykcji.

Uwaga: Wzory w kolumnie F pokazują, jak obliczono wartości w kolumnie E.

Jak obliczyć interwał przewidywania w programie Excel

95% przedział przewidywania dla wartości x 0 = 3 wynosi (74,64; 86,90) . Oznacza to, że z 95% prawdopodobieństwem przewidujemy, że student studiujący 3 godziny uzyska wynik pomiędzy 74,64 a 86,90.

Kilka uwag na temat zastosowanych obliczeń:

  • Aby obliczyć wartość krytyczną t t α/2,df=n-2, użyliśmy α/2 = 0,05/2 = 0,25, ponieważ chcieliśmy przedziału predykcji wynoszącego 95%. Należy zauważyć, że wyższe przedziały przewidywania (np. 99% przedział przewidywania) prowadzą do szerszych przedziałów. I odwrotnie, mniejszy przedział przewidywania (np. 90% przedział przewidywania) będzie prowadził do węższego przedziału.
  • Użyliśmy wzoru =PROGNOZA() , aby uzyskać przewidywaną wartość dla ŷ 0 , ale formuła =PROGNOZA.LINEAR() zwróci dokładnie tę samą wartość.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *