Prosta regresja liniowa

W tym artykule wyjaśniono, czym jest prosta regresja liniowa w statystyce i jak jest wykonywana. W Internecie znajdziesz także rozwiązanie prostego ćwiczenia regresji liniowej oraz dodatkowo prosty kalkulator regresji liniowej.

Co to jest prosta regresja liniowa?

Prosta regresja liniowa to model statystyczny używany do powiązania zmiennej niezależnej i staramy się przybliżyć związek Co istnieje pomiędzy dwiema zmiennymi.

Dlatego do znalezienia równania, które łączy liniowo dwie zmienne, stosuje się prostą regresję liniową. Logicznie rzecz biorąc, związek między dwiema zmiennymi musi być liniowy, w przeciwnym razie należy zastosować inny typ modelu regresji.

Równanie prostego modelu regresji liniowej składa się z dwóch współczynników: stałej równania (b 0 ) i współczynnika korelacji pomiędzy obiema zmiennymi (b 1 ). Dlatego równanie prostego modelu regresji liniowej to y=b 0 +b 1 x.

y=b_0+b_1x

Równanie prostej regresji liniowej przedstawiono na wykresie jako linię prostą, więc współczynnik b 0 to punkt przecięcia, a współczynnik b 1 to nachylenie linii.

Proste wzory regresji liniowej

Wzory na obliczenie współczynników prostej regresji liniowej są następujące:

proste wzory regresji liniowej

👉 Poniższy kalkulator umożliwia obliczenie współczynników prostej regresji liniowej dla dowolnego zbioru danych.

Oczywiście równanie wynikające z prostego modelu regresji liniowej nie będzie w stanie odgadnąć dokładnej wartości wszystkich obserwacji, ponieważ model ten po prostu próbuje znaleźć równanie przybliżające zależność między dwiema zmiennymi. Zatem resztę definiuje się jako różnicę między wartością prawdziwą a wartością oszacowaną za pomocą modelu regresji liniowej.

e_i=y_i-\widehat{y}_i

Należy zauważyć, że celem prostego modelu regresji liniowej jest minimalizacja kwadratów reszt, co oznacza, że prosta regresja liniowa opiera się na kryterium najmniejszych kwadratów .

Konkretny przykład prostej regresji liniowej

Aby zakończyć zrozumienie metody prostej regresji liniowej, poniżej znajduje się praktyczny przykład krok po kroku, w którym równanie prostego modelu regresji liniowej jest obliczane na podstawie zestawu danych statystycznych.

  • Po zdaniu egzaminu ze statystyki pięciu studentów zostało zapytanych, ile godzin nauki poświęcili na egzamin. Dane zostały zaprezentowane w poniższej tabeli. Wykonaj prosty model regresji liniowej zebranych danych statystycznych, aby liniowo powiązać godziny nauki z uzyskaną oceną.

Aby przeprowadzić prosty model regresji liniowej, musimy wyznaczyć współczynniki b 0 i b 1 równania i w tym celu musimy skorzystać ze wzorów przedstawionych w powyższej sekcji.

Aby jednak zastosować proste wzory regresji liniowej, musimy najpierw obliczyć średnią zmiennej niezależnej i średnią zmiennej zależnej:

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

Teraz, gdy znamy średnie zmiennych, obliczamy współczynnik b 1 modelu, korzystając z odpowiedniego wzoru:

\begin{array}{c}b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] b_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]b_1=0,4412\end{array}

Na koniec obliczamy współczynnik b 0 modelu, korzystając z odpowiedniego wzoru:

\begin{array}{l}b_0=\overline{y}-b_1\overline{x}\\[3ex]b_0=6-0,4412\cdot 9 \\[3ex]b_0=2,0294\end{array}

Krótko mówiąc, równanie prostego modelu regresji liniowej problemu wygląda następująco:

y=2,0294+0,4412x

Poniżej możesz zobaczyć graficzną reprezentację przykładowych danych, a także linię prostą prostego modelu regresji liniowej:

prosty przykład regresji liniowej

Na koniec, gdy już obliczyliśmy równanie prostego modelu regresji liniowej, pozostaje nam jedynie zinterpretować uzyskany wynik. W tym celu niezbędne jest obliczenie współczynnika determinacji modelu regresji, można zobaczyć jak to się robi wyszukując odpowiedni artykuł na naszej stronie internetowej.

Proste założenia regresji liniowej

Aby przeprowadzić prostą regresję liniową należy spełnić następujące założenia:

  • Niezależność : obserwowane reszty muszą być od siebie niezależne. Powszechnym sposobem zapewnienia niezależności modelu jest dodanie losowości do procesu próbkowania.
  • Homoscedastyczność : wariancje reszt muszą być jednorodne, to znaczy zmienność reszt musi być stała.
  • Normalność : reszty muszą mieć rozkład normalny, czyli innymi słowy muszą mieć rozkład normalny ze średnią 0.
  • Liniowość – zależność pomiędzy zmienną niezależną a zmienną zależną powinna być liniowa.

Prosty kalkulator regresji liniowej

Podłącz przykładowe dane do poniższego kalkulatora, aby dopasować prosty model regresji liniowej pomiędzy dwiema zmiennymi. Należy rozdzielić pary danych tak, aby w pierwszym polu znajdowały się tylko wartości zmiennej niezależnej X, a w drugim polu znajdowały się wyłącznie wartości zmiennej zależnej Y.

Dane należy oddzielić spacją i wprowadzić z użyciem kropki jako separatora dziesiętnego.

  • Niezależna zmienna

  • Zmienna zależna Y:

Prosta i wielokrotna regresja liniowa

Na koniec zobaczymy, jaka jest różnica między prostą regresją liniową a wielokrotną regresją liniową, ponieważ są to dwa rodzaje regresji liniowej często stosowane w statystyce.

Wielokrotna regresja liniowa umożliwia matematyczne powiązanie dwóch lub większej liczby zmiennych objaśniających ze zmienną odpowiedzi. Oznacza to, że w wielokrotnej regresji liniowej tworzony jest model, w którym występują co najmniej dwie zmienne niezależne.

Dlatego różnica między prostą regresją liniową a wielokrotną regresją liniową polega na liczbie zmiennych niezależnych. W prostej regresji liniowej istnieje tylko jedna zmienna niezależna, podczas gdy w wielokrotnej regresji liniowej istnieją dwie lub więcej zmiennych niezależnych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *