Co to jest regresor? (definicja i przykłady)
W statystyce regresor to nazwa nadana dowolnej zmiennej w modelu regresji, używana do przewidywania zmiennej odpowiedzi.
Regresor nazywany jest również:
- Zmienna objaśniająca
- Zmienna niezależna
- Zmienna zmanipulowana
- Zmienna prognoza
- Charakterystyczny
Wszystkie te terminy są używane zamiennie w zależności od rodzaju dziedziny, w której pracujesz: statystyka, uczenie maszynowe, ekonometria, biologia itp.
Uwaga: czasami zmienna odpowiedzi nazywana jest „regresywną”.
Regresory w modelach regresji
Większość modeli regresji ma następującą postać:
Y = β 0 + B 1 x 1 + B 2 x 2 + B 3 x 3 + ε
Złoto:
- Y: zmienna odpowiedzi
- β i : Współczynniki regresorów
- x i : Regresory
- ε: Termin błędu
Celem budowania modelu regresji jest zrozumienie, w jaki sposób zmiany w regresorze prowadzą do zmian w zmiennej odpowiedzi (lub „regresorze”).
Należy pamiętać, że modele regresji mogą mieć jeden lub więcej regresorów.
Jeśli istnieje tylko jeden regresor, model nazywa się prostym modelem regresji liniowej , a gdy istnieje wiele regresorów, model nazywa się modelem wielokrotnej regresji liniowej , aby wskazać, że istnieje wiele regresorów.
Poniższe przykłady ilustrują sposób interpretacji regresorów w różnych modelach regresji.
Przykład 1: Wydajność upraw
Załóżmy, że rolnik chce zrozumieć czynniki wpływające na całkowity plon (w funtach). Zbiera dane i buduje następujący model regresji:
Plony = 154,34 + 3,56*(funty nawozu) + 1,89*(funty gleby)
Model ten ma dwa regresory: Nawóz i Gleba.
Oto jak interpretować te dwa regresory:
- Nawóz: każdy dodatkowy funt użytego nawozu zwiększa plony średnio o 3,56 funta, przy założeniu, że ilość gleby pozostaje stała.
- Gleba: Na każdy dodatkowy funt użytej gleby plony zwiększają się średnio o 1,89 funta, przy założeniu, że ilość nawozu pozostaje stała.
Przykład 2: Wyniki egzaminu
Załóżmy, że profesor chce zrozumieć, jak liczba przepracowanych godzin wpływa na wyniki egzaminu. Zbiera dane i buduje następujący model regresji:
Wynik egzaminu = 68,34 + 3,44* (godziny nauki)
Model ten zawiera regresor: przestudiowane godziny. Interpretujemy współczynnik tego regresora w ten sposób, że za każdą dodatkową przestudiowaną godzinę wynik egzaminu wzrasta średnio o 3,44 punktu.
Dodatkowe zasoby
Jak interpretować współczynniki regresji
Jak sprawdzić znaczenie nachylenia regresji
Jak czytać i interpretować tabelę regresji