Interpolazione o estrapolazione: qual è la differenza?


Due termini che gli studenti spesso confondono in statistica sono interpolazione ed estrapolazione .

Ecco la differenza:

L’interpolazione si riferisce alla previsione di valori che rientrano in un intervallo di punti dati.

L’estrapolazione si riferisce alla previsione di valori che non rientrano in un intervallo di punti dati.

L’esempio seguente illustra la differenza tra i due termini.

Esempio: interpolazione ed estrapolazione

Supponiamo di avere il seguente set di dati:

Possiamo decidere di adattare un semplice modello di regressione lineare a questi punti:

Potremmo quindi utilizzare il modello di regressione adattato per prevedere i valori dei punti sia all’interno che all’esterno dell’intervallo dei punti dati.

Quando utilizziamo il modello di regressione adattato per prevedere i valori dei punti all’interno dell’intervallo esistente di punti dati, si parla di interpolazione.

Al contrario, quando utilizziamo il modello di regressione adattato per prevedere valori puntuali al di fuori dell’intervallo esistente, si parla di estrapolazione :

Il potenziale pericolo di estrapolazione

Quando estrapoliamo, presupponiamo che lo stesso modello esistente all’interno dell’intervallo corrente di punti dati esista anche all’esterno dell’intervallo.

Tuttavia, questo può essere un presupposto pericoloso perché è possibile che il modello esistente al di fuori dell’attuale intervallo di dati sia molto diverso:

il pericolo di estrapolazione

Per questo motivo, può essere pericoloso utilizzare l’estrapolazione per prevedere valori di punti dati che non rientrano nell’intervallo di valori utilizzato per creare il modello di regressione.

In pratica, spesso ha senso utilizzare l’estrapolazione per prevedere valori puntuali che cadono leggermente al di fuori dell’intervallo dei valori esistenti, ma più ci si allontana dall’intervallo, più è probabile che la differenza tra il valore previsto e quello effettivo il valore è importante. .

Quando utilizzare l’estrapolazione

Spesso sono necessarie competenze specifiche del settore per determinare se l’estrapolazione è un’idea ragionevole o meno.

Ad esempio, supponiamo che il reparto marketing di un’azienda applichi un semplice modello di regressione lineare utilizzando la spesa pubblicitaria come variabile predittiva e le entrate totali come variabile di risposta.

In questo scenario, può essere ragionevole supporre che un aumento costante della spesa pubblicitaria si tradurrà in un aumento prevedibile delle entrate totali:

In questo scenario, possiamo essere abbastanza fiduciosi nella nostra capacità di estrapolare valori.

Tuttavia, considera uno scenario in cui un biologo desidera utilizzare il fertilizzante totale per prevedere la crescita delle piante.

Potrebbe decidere di adattare un semplice modello di regressione lineare ai punti dati, ma poiché esiste un limite superiore all’altezza delle piante, probabilmente non ha senso utilizzare l’estrapolazione per prevedere i valori dei punti. al di fuori dell’intervallo di valori. valori utilizzati per adattare il modello:

In questo scenario, potremmo avere molta meno fiducia nella nostra capacità di estrapolare valori.

Conclusione: l’ estrapolazione può avere più senso in alcune aree piuttosto che in altre, ma esiste sempre il pericolo potenziale che il modello esistente nell’intervallo di valori utilizzati per adattarlo non esista al di fuori della spiaggia.

Risorse addizionali

Come eseguire l’interpolazione lineare in Excel
Come fare previsioni con la regressione lineare

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *