4 przykłady wykorzystania regresji liniowej w prawdziwym życiu
Regresja liniowa jest jedną z najczęściej stosowanych technik statystycznych. Służy do ilościowego określenia związku między jedną lub większą liczbą zmiennych predykcyjnych a zmienną odpowiedzi.
Najbardziej podstawowa forma regresji liniowej znana jest jako prosta regresja liniowa , która służy do ilościowego określenia związku między zmienną predykcyjną a zmienną odpowiedzi.
Jeśli mamy wiele zmiennych predykcyjnych, możemy zastosować wielokrotną regresję liniową, która służy do ilościowego określenia związku między wieloma zmiennymi predykcyjnymi a zmienną odpowiedzi.
W tym samouczku przedstawiono cztery różne przykłady zastosowania regresji liniowej w prawdziwym życiu.
Przykład prawdziwej regresji liniowej nr 1
Firmy często korzystają z regresji liniowej, aby zrozumieć związek między wydatkami na reklamę a przychodami.
Można na przykład dopasować prosty model regresji liniowej, wykorzystując wydatki na reklamę jako zmienną predykcyjną i przychody jako zmienną odpowiedzi. Model regresji miałby następującą postać:
przychody = β 0 + β 1 (wydatki na reklamę)
Współczynnik β 0 reprezentuje całkowity dochód oczekiwany, gdy wydatki na reklamę wynoszą zero.
Współczynnik β 1 reprezentowałby średnią zmianę całkowitego dochodu, gdy wydatki na reklamę wzrosną o jedną jednostkę (na przykład o jednego dolara).
Jeżeli β 1 jest ujemne, oznaczałoby to, że wzrost wydatków na reklamę wiąże się ze spadkiem przychodów.
Jeżeli β 1 jest bliskie zeru, oznaczałoby to, że wydatki na reklamę mają niewielki wpływ na przychody.
A jeśli β1 jest dodatnie, oznaczałoby to, że większe wydatki na reklamę wiążą się z większymi przychodami.
W zależności od wartości β 1 firma może podjąć decyzję o zmniejszeniu lub zwiększeniu wydatków na reklamę.
Przykład prawdziwej regresji liniowej nr 2
Badacze medyczni często stosują regresję liniową, aby zrozumieć związek między dawką leku a ciśnieniem krwi pacjenta.
Na przykład badacze mogą podawać pacjentom różne dawki określonego leku i obserwować reakcję ich ciśnienia krwi. Mogliby dopasować prosty model regresji liniowej, wykorzystując dawkę jako zmienną predykcyjną i ciśnienie krwi jako zmienną odpowiedzi. Model regresji miałby następującą postać:
ciśnienie krwi = β 0 + β 1 (dawkowanie)
Współczynnik β 0 reprezentuje oczekiwane ciśnienie krwi przy dawce wynoszącej zero.
Współczynnik β 1 reprezentuje średnią zmianę ciśnienia krwi po zwiększeniu dawki o jedną jednostkę.
Jeżeli β1 jest ujemne, oznacza to, że zwiększenie dawki wiąże się ze spadkiem ciśnienia krwi.
Jeśli β1 jest bliskie zeru, oznacza to, że zwiększenie dawki nie wiąże się z jakąkolwiek zmianą ciśnienia krwi.
Jeżeli β1 jest dodatnie, oznacza to, że zwiększenie dawki wiąże się ze wzrostem ciśnienia krwi.
W zależności od wartości β 1 badacze mogą podjąć decyzję o modyfikacji dawki podawanej pacjentowi.
Przykład prawdziwej regresji liniowej nr 3
Agronomowie często stosują regresję liniową do pomiaru wpływu nawozów i wody na plony.
Na przykład naukowcy mogliby stosować różne ilości nawozów i wody na różnych polach i sprawdzać, jak wpływa to na plony. Mogliby dopasować model regresji liniowej wielokrotnej, wykorzystując nawozy i wodę jako zmienne predykcyjne oraz plony jako zmienną odpowiedzi. Model regresji miałby następującą postać:
plon = β 0 + β 1 (ilość nawozu) + β 2 (ilość wody)
Współczynnik β 0 reprezentuje oczekiwany plon bez nawozu i wody.
Współczynnik β 1 przedstawiałby średnią zmianę plonu po zwiększeniu nawozu o jedną jednostkę, przy założeniu, że ilość wody pozostaje niezmieniona.
Współczynnik β 2 przedstawiałby średnią zmianę plonu po zwiększeniu ilości wody o jedną jednostkę, przy założeniu, że ilość nawozu pozostanie niezmieniona.
W zależności od wartości β1 i β2 naukowcy mogą zmieniać ilość użytego nawozu i wody, aby zmaksymalizować plony.
Przykład prawdziwej regresji liniowej nr 4
Naukowcy zajmujący się danymi dla profesjonalnych drużyn sportowych często korzystają z regresji liniowej, aby zmierzyć wpływ różnych programów treningowych na wyniki zawodników.
Na przykład badacze danych z NBA mogą analizować, jak różna liczba cotygodniowych sesji jogi i podnoszenia ciężarów wpływa na liczbę punktów zdobytych przez gracza. Mogliby dopasować model regresji liniowej, wykorzystując sesje jogi i sesje podnoszenia ciężarów jako zmienne predykcyjne, a całkowitą liczbę zdobytych punktów jako zmienną odpowiedzi. Model regresji miałby następującą postać:
zdobyte punkty = β 0 + β 1 (sesje jogi) + β 2 (sesje podnoszenia ciężarów)
Współczynnik β 0 reprezentowałby oczekiwaną liczbę punktów zdobytych przez zawodnika, który nie uczestniczy w sesjach jogi ani w sesjach podnoszenia ciężarów.
Współczynnik β 1 reprezentowałby średnią zmianę zdobytych punktów w przypadku zwiększenia cotygodniowych sesji jogi o jeden, przy założeniu, że liczba cotygodniowych sesji podnoszenia ciężarów pozostaje niezmieniona.
Współczynnik β 2 reprezentowałby średnią zmianę zdobytych punktów w przypadku zwiększenia cotygodniowych sesji podnoszenia ciężarów o jeden, przy założeniu, że liczba cotygodniowych sesji jogi pozostaje niezmieniona.
W zależności od wartości β 1 i β 2 badacze danych mogą zalecić graczowi udział w sesjach jogi i podnoszenia ciężarów mniej więcej raz w tygodniu, aby zmaksymalizować zdobyte punkty.
Wniosek
Regresję liniową stosuje się w wielu różnych sytuacjach rzeczywistych w wielu typach branż. Na szczęście oprogramowanie statystyczne ułatwia przeprowadzenie regresji liniowej.
Zachęcamy do zapoznania się z poniższymi samouczkami, aby dowiedzieć się, jak przeprowadzić regresję liniową przy użyciu innego oprogramowania:
Jak wykonać prostą regresję liniową w programie Excel
Jak wykonać wielokrotną regresję liniową w programie Excel
Jak wykonać wielokrotną regresję liniową w R
Jak wykonać wielokrotną regresję liniową w Stata
Jak wykonać regresję liniową na kalkulatorze TI-84