Come individuare il trend dei dati: con esempi


“Detendere” i dati delle serie temporali significa rimuovere una tendenza sottostante nei dati. Il motivo principale per cui vogliamo farlo è visualizzare più facilmente le tendenze sottostanti nei dati stagionali o ciclici.

Ad esempio, considera i seguenti dati della serie temporale che rappresentano le vendite totali di un’azienda per 20 periodi consecutivi:

Espandi i dati delle serie temporali

Ovviamente, le vendite tendono ad aumentare nel tempo, ma sembra esserci anche un andamento ciclico o stagionale nei dati, come evidenziato dalle minuscole “colline” che si verificano nel tempo.

Per avere una visione migliore di questa tendenza ciclica, possiamo sgonfiare i dati. In questo caso, ciò comporterebbe la rimozione della tendenza complessiva al rialzo nel tempo in modo che i dati risultanti rappresentino solo la tendenza ciclica.

Esempio di dati di serie temporali con trend

Esistono due metodi comuni utilizzati per deflazionare i dati delle serie temporali:

1. Tendenza per differenziazione

2. Degrado dovuto all’adattamento del modello

Questo tutorial fornisce una breve spiegazione di ciascun metodo.

Metodo 1: Rilassamento per differenziazione

Un modo per eliminare il trend dei dati delle serie temporali è semplicemente creare un nuovo set di dati in cui ciascuna osservazione rappresenta la differenza tra se stessa e l’osservazione precedente.

Ad esempio, l’immagine seguente mostra come utilizzare la differenziazione per eliminare la tendenza di una serie di dati.

Per ottenere il primo valore dei dati della serie temporale senza trend, calcoliamo 13 – 8 = 5. Quindi, per ottenere il valore successivo, calcoliamo 18-13 = 5 e così via.

Espandi i dati delle serie temporali differenziandoli

Il grafico seguente mostra i dati della serie temporale originale:

Espandi i dati delle serie temporali

E questo grafico mostra i dati senza tendenza:

Esempio di dati di serie temporali con trend

Nota quanto è più semplice vedere la tendenza stagionale nei dati delle serie temporali in questo grafico perché la tendenza generale al rialzo è stata rimossa.

Metodo 2: Degrado mediante adattamento del modello

Un altro modo per eliminare il trend dei dati delle serie temporali è adattare un modello di regressione ai dati e quindi calcolare la differenza tra i valori osservati e i valori previsti dal modello.

Ad esempio, supponiamo di avere lo stesso set di dati:

Se adattiamo ai dati un semplice modello di regressione lineare , possiamo ottenere un valore previsto per ciascuna osservazione nel set di dati.

Possiamo quindi trovare la differenza tra il valore effettivo e il valore previsto per ciascuna osservazione. Queste differenze rappresentano dati detrend.

Dati in detendenza in base all'adattamento del modello

Se creiamo un grafico dei dati senza trend, possiamo visualizzare molto più facilmente l’andamento stagionale o ciclico dei dati:

Tieni presente che in questo esempio abbiamo utilizzato la regressione lineare, ma è possibile utilizzare un metodo più complesso come la regressione esponenziale se nei dati è presente una tendenza più esponenziale al rialzo o al ribasso.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *