Comment réduire la tendance des données : avec des exemples
« Réduire la tendance » des données de séries chronologiques signifie supprimer une tendance sous-jacente dans les données. La principale raison pour laquelle nous souhaitons procéder ainsi est de visualiser plus facilement les sous-tendances des données qui sont saisonnières ou cycliques.
Par exemple, considérons les données de séries chronologiques suivantes qui représentent les ventes totales d’une entreprise pendant 20 périodes consécutives :
De toute évidence, les ventes ont tendance à augmenter au fil du temps, mais il semble également y avoir une tendance cyclique ou saisonnière dans les données, comme en témoignent les minuscules « collines » qui se produisent au fil du temps.
Pour avoir une meilleure vision de cette tendance cyclique, nous pouvons détendre les données. Dans ce cas, cela impliquerait de supprimer la tendance globale à la hausse au fil du temps afin que les données résultantes représentent uniquement la tendance cyclique.
Il existe deux méthodes courantes utilisées pour détendre les données de séries chronologiques :
1. Détendance par différenciation
2. Dégradation par ajustement de modèle
Ce didacticiel fournit une brève explication de chaque méthode.
Méthode 1 : Détendance par différenciation
Une façon de réduire la tendance des données de séries chronologiques consiste simplement à créer un nouvel ensemble de données dans lequel chaque observation représente la différence entre elle-même et l’observation précédente.
Par exemple, l’image suivante montre comment utiliser la différenciation pour réduire la tendance d’une série de données.
Pour obtenir la première valeur des données de la série chronologique sans tendance, nous calculons 13 – 8 = 5. Ensuite, pour obtenir la valeur suivante, nous calculons 18-13 = 5, et ainsi de suite.
Le graphique suivant montre les données de la série chronologique d’origine :
Et ce graphique montre les données sans tendance :
Remarquez à quel point il est beaucoup plus facile de voir la tendance saisonnière dans les données de séries chronologiques dans ce graphique, car la tendance globale à la hausse a été supprimée.
Méthode 2 : dégradation par ajustement de modèle
Une autre façon de réduire la tendance des données de séries chronologiques consiste à ajuster un modèle de régression aux données, puis à calculer la différence entre les valeurs observées et les valeurs prédites du modèle.
Par exemple, supposons que nous ayons le même ensemble de données :
Si nous ajustons un modèle de régression linéaire simple aux données, nous pouvons obtenir une valeur prédite pour chaque observation de l’ensemble de données.
Nous pouvons alors trouver la différence entre la valeur réelle et la valeur prédite pour chaque observation. Ces différences représentent les données sans tendance.
Si nous créons un graphique des données sans tendance, nous pouvons visualiser beaucoup plus facilement la tendance saisonnière ou cyclique des données :
Notez que nous avons utilisé la régression linéaire dans cet exemple, mais il est possible d’utiliser une méthode plus complexe comme la régression exponentielle s’il existe davantage une tendance exponentielle à la hausse ou à la baisse dans les données.