Come individuare il trend dei dati: con esempi
“Detendere” i dati delle serie temporali significa rimuovere una tendenza sottostante nei dati. Il motivo principale per cui vogliamo farlo è visualizzare più facilmente le tendenze sottostanti nei dati stagionali o ciclici.
Ad esempio, considera i seguenti dati della serie temporale che rappresentano le vendite totali di un’azienda per 20 periodi consecutivi:
Ovviamente, le vendite tendono ad aumentare nel tempo, ma sembra esserci anche un andamento ciclico o stagionale nei dati, come evidenziato dalle minuscole “colline” che si verificano nel tempo.
Per avere una visione migliore di questa tendenza ciclica, possiamo sgonfiare i dati. In questo caso, ciò comporterebbe la rimozione della tendenza complessiva al rialzo nel tempo in modo che i dati risultanti rappresentino solo la tendenza ciclica.
Esistono due metodi comuni utilizzati per deflazionare i dati delle serie temporali:
1. Tendenza per differenziazione
2. Degrado dovuto all’adattamento del modello
Questo tutorial fornisce una breve spiegazione di ciascun metodo.
Metodo 1: Rilassamento per differenziazione
Un modo per eliminare il trend dei dati delle serie temporali è semplicemente creare un nuovo set di dati in cui ciascuna osservazione rappresenta la differenza tra se stessa e l’osservazione precedente.
Ad esempio, l’immagine seguente mostra come utilizzare la differenziazione per eliminare la tendenza di una serie di dati.
Per ottenere il primo valore dei dati della serie temporale senza trend, calcoliamo 13 – 8 = 5. Quindi, per ottenere il valore successivo, calcoliamo 18-13 = 5 e così via.
Il grafico seguente mostra i dati della serie temporale originale:
E questo grafico mostra i dati senza tendenza:
Nota quanto è più semplice vedere la tendenza stagionale nei dati delle serie temporali in questo grafico perché la tendenza generale al rialzo è stata rimossa.
Metodo 2: Degrado mediante adattamento del modello
Un altro modo per eliminare il trend dei dati delle serie temporali è adattare un modello di regressione ai dati e quindi calcolare la differenza tra i valori osservati e i valori previsti dal modello.
Ad esempio, supponiamo di avere lo stesso set di dati:
Se adattiamo ai dati un semplice modello di regressione lineare , possiamo ottenere un valore previsto per ciascuna osservazione nel set di dati.
Possiamo quindi trovare la differenza tra il valore effettivo e il valore previsto per ciascuna osservazione. Queste differenze rappresentano dati detrend.
Se creiamo un grafico dei dati senza trend, possiamo visualizzare molto più facilmente l’andamento stagionale o ciclico dei dati:
Tieni presente che in questo esempio abbiamo utilizzato la regressione lineare, ma è possibile utilizzare un metodo più complesso come la regressione esponenziale se nei dati è presente una tendenza più esponenziale al rialzo o al ribasso.