Inferenza e previsione: qual è la differenza?
Spesso nelle statistiche vogliamo utilizzare i dati per uno dei due motivi:
(1) Inferenza: vogliamo comprendere la natura della relazione tra le variabili predittive e la variabile di risposta in un set di dati esistente.
(2) Previsione: vogliamo utilizzare un set di dati esistente per costruire un modello che preveda il valore della variabile di risposta di una nuova osservazione.
Ad esempio, supponiamo di avere il seguente set di dati contenente informazioni sulle case:
Un esempio di inferenza:
Supponiamo di costruire un modello di regressione lineare multipla utilizzando la metratura, il numero di camere da letto e il numero di bagni come variabili predittive e il prezzo come variabile di risposta.
Potremmo quindi utilizzare i coefficienti di regressione per comprendere la variazione media del prezzo associata a una variazione di un’unità in ciascuna delle variabili predittive.
Ad esempio, potremmo capire quanto cambia il prezzo (in media) per ogni camera da letto aggiuntiva, ogni bagno aggiuntivo e ogni metro quadrato aggiuntivo.
Un esempio di previsione:
Potremmo costruire lo stesso modello di regressione lineare multipla e utilizzarlo per prevedere il valore di una nuova casa in base alla metratura, al numero di camere da letto e al numero di bagni.
Ad esempio, potremmo utilizzare il modello per prevedere il prezzo di una nuova casa con 3 camere da letto, 3 bagni e 2.000 piedi quadrati.
Potremmo quindi confrontare la nostra previsione con il prezzo di listino effettivo e valutare se la casa appare sottovalutata o sopravvalutata.
I seguenti esempi illustrano la differenza tra inferenza e previsione in diversi scenari:
Esempio 1: Inferenza e previsione nello sport
Supponiamo di avere il seguente set di dati contenente informazioni sulle squadre di basket professionistiche:
Un esempio di inferenza:
Supponiamo di costruire un modello di regressione lineare multipla utilizzando punti, rimbalzi e assist come variabili predittive e vittorie come variabile di risposta.
Potremmo quindi utilizzare il modello per capire quanto cambia il numero di vittorie (in media) con ogni punto, rimbalzo e assist aggiuntivi.
Un esempio di previsione:
Potremmo costruire lo stesso modello di regressione lineare multipla e utilizzarlo per prevedere quante vittorie otterrà una squadra in base al numero di punti, rimbalzi e assist.
Ad esempio, potremmo utilizzare il modello per prevedere quante vittorie avrà una squadra con 90 punti, 40 rimbalzi e 30 assist.
Esempio 2: Inferenza e previsione nel mondo degli affari
Supponiamo di avere il seguente set di dati contenente informazioni sui ricavi annuali (in milioni) di varie società:
Un esempio di inferenza:
Supponiamo di costruire un modello di regressione lineare multipla utilizzando la spesa pubblicitaria, il numero di dipendenti e le acquisizioni totali come variabili predittive e le entrate annuali come variabile di risposta.
Potremmo quindi utilizzare il modello per capire quanto cambiano le entrate annuali totali (in media) con ogni dollaro aggiuntivo speso in pubblicità, ogni dipendente aggiuntivo e ogni acquisizione aggiuntiva.
Un esempio di previsione:
Potremmo costruire lo stesso modello di regressione lineare multipla e utilizzarlo per prevedere le entrate annuali di un’azienda in base alla spesa totale di marketing, al numero di dipendenti e alle acquisizioni totali.
Ad esempio, potremmo utilizzare il modello per prevedere il fatturato annuo di un’azienda che spende 25 milioni di dollari in pubblicità, ha 40 dipendenti e ha effettuato 2 acquisizioni.
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive su termini importanti da comprendere nelle statistiche:
Statistica descrittiva o inferenziale: qual è la differenza?
Livelli di misura: nominale, ordinale, intervallo e rapporto
Variabili qualitative e quantitative: qual è la differenza?