Wnioskowanie i przewidywanie: jaka jest różnica?
Często w statystykach chcemy wykorzystać dane z jednego z dwóch powodów:
(1) Wnioskowanie: chcemy zrozumieć naturę związku między zmiennymi predykcyjnymi azmienną odpowiedzi w istniejącym zbiorze danych.
(2) Prognoza: chcemy wykorzystać istniejący zbiór danych do zbudowania modelu, który przewiduje wartość zmiennej odpowiedzi nowej obserwacji.
Załóżmy na przykład, że mamy następujący zbiór danych zawierający informacje o domach:
Przykład wnioskowania:
Załóżmy, że budujemy model regresji liniowej, wykorzystując powierzchnię mieszkalną, liczbę sypialni i liczbę łazienek jako zmienne predykcyjne oraz cenę jako zmienną odpowiedzi.
Moglibyśmy następnie użyć współczynników regresji, aby zrozumieć średnią zmianę ceny związaną ze zmianą o jedną jednostkę każdej ze zmiennych predykcyjnych.
Na przykład moglibyśmy zrozumieć, jak bardzo zmienia się cena (średnio) z każdą dodatkową sypialnią, każdą dodatkową łazienką i każdym dodatkowym metr kwadratowy.
Przykład przewidywania:
Moglibyśmy zbudować ten sam model regresji liniowej i użyć go do przewidywania wartości nowego domu na podstawie jego powierzchni, liczby sypialni i łazienek.
Na przykład moglibyśmy użyć tego modelu do przewidywania ceny nowego domu z 3 sypialniami, 3 łazienkami i 2000 stóp kwadratowych.
Moglibyśmy następnie porównać nasze przewidywania z rzeczywistą ceną ofertową i ocenić, czy dom wydaje się zaniżony, czy też zawyżony.
Poniższe przykłady ilustrują różnicę między wnioskowaniem a przewidywaniem w różnych scenariuszach:
Przykład 1: Wnioskowanie i przewidywanie w sporcie
Załóżmy, że mamy następujący zbiór danych zawierający informacje o zawodowych drużynach koszykówki:
Przykład wnioskowania:
Załóżmy, że budujemy model regresji liniowej, wykorzystując punkty, zbiórki i asysty jako zmienne predykcyjne oraz zwycięstwa jako zmienną reakcji.
Moglibyśmy następnie użyć tego modelu, aby zrozumieć, jak bardzo zmienia się liczba zwycięstw (średnio) z każdym dodatkowym punktem, odbiciem i asystą.
Przykład przewidywania:
Moglibyśmy zbudować ten sam model regresji liniowej i użyć go do przewidywania liczby zwycięstw drużyny na podstawie liczby punktów, zbiórek i asyst.
Na przykład moglibyśmy użyć tego modelu do przewidzenia, ile zwycięstw odniesie zespół z 90 punktami, 40 zbiórkami i 30 asystami.
Przykład 2: Wnioskowanie i przewidywanie w biznesie
Załóżmy, że mamy następujący zbiór danych zawierający informacje o rocznych przychodach (w milionach) różnych firm:
Przykład wnioskowania:
Załóżmy, że budujemy model regresji liniowej, wykorzystując wydatki na reklamę, liczbę pracowników i łączną liczbę przejęć jako zmienne predykcyjne, a roczny przychód jako zmienną odpowiedzi.
Następnie moglibyśmy użyć tego modelu, aby zrozumieć, jak bardzo zmieniają się całkowite roczne przychody (średnio) z każdym dodatkowym dolarem wydanym na reklamę, każdym dodatkowym pracownikiem i każdym dodatkowym przejęciem.
Przykład przewidywania:
Moglibyśmy zbudować ten sam model regresji liniowej i wykorzystać go do przewidywania rocznych przychodów firmy na podstawie całkowitych wydatków marketingowych, liczby pracowników i całkowitej liczby przejęć.
Na przykład moglibyśmy użyć tego modelu do przewidywania rocznych przychodów firmy, która wydaje 25 milionów dolarów na reklamę, zatrudnia 40 pracowników i dokonała 2 przejęć.
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat ważnych terminów stosowanych w statystykach:
Statystyki opisowe lub wnioskowane: jaka jest różnica?
Poziomy pomiaru: nominalny, porządkowy, interwałowy i ilorazowy
Zmienne jakościowe i ilościowe: jaka jest różnica?