Comment calculer l’autocorrélation en Python
L’autocorrélation mesure le degré de similarité entre une série temporelle et une version décalée d’elle-même sur des intervalles de temps successifs.
On l’appelle aussi parfois « corrélation en série » ou « corrélation décalée », car elle mesure la relation entre les valeurs actuelles d’une variable et ses valeurs historiques.
Lorsque l’autocorrélation dans une série chronologique est élevée, il devient facile de prédire les valeurs futures en se référant simplement aux valeurs passées.
Comment calculer l’autocorrélation en Python
Supposons que nous ayons la série chronologique suivante en Python qui montre la valeur d’une certaine variable pendant 15 périodes différentes :
#define data
x = [22, 24, 25, 25, 28, 29, 34, 37, 40, 44, 51, 48, 47, 50, 51]
Nous pouvons calculer l’autocorrélation pour chaque décalage de la série chronologique en utilisant la fonction acf() de la bibliothèque statsmodels :
import statsmodels.api as sm #calculate autocorrelations sm.tsa.acf(x) array([ 1. , 0.83174224, 0.65632458, 0.49105012, 0.27863962, 0.03102625, -0.16527446, -0.30369928, -0.40095465, -0.45823389, -0.45047733])
La façon d’interpréter le résultat est la suivante :
- L’autocorrélation au décalage 0 est 1 .
- L’autocorrélation au décalage 1 est de 0,8317 .
- L’autocorrélation au décalage 2 est de 0,6563 .
- L’autocorrélation au décalage 3 est de 0,4910 .
Et ainsi de suite.
On peut également spécifier le nombre de décalages à utiliser avec l’argument nlags :
sm.tsa.acf(x, nlags=5)
array([1.0, 0.83174224, 0.65632458, 0.49105012, 0.27863962, 0.03102625])
Comment tracer la fonction d’autocorrélation en Python
Nous pouvons tracer la fonction d’autocorrélation pour une série temporelle en Python en utilisant la fonction tsaplots.plot_acf() de la bibliothèque statsmodels :
from statsmodels.graphics import tsaplots import matplotlib.pyplot as plt #plot autocorrelation function fig = tsaplots.plot_acf(x, lags=10) plt.show()
L’axe des x affiche le nombre de décalages et l’axe des y affiche l’autocorrélation à ce nombre de décalages. Par défaut, le tracé commence à lag = 0 et l’autocorrélation sera toujours de 1 à lag = 0.
On peut également zoomer sur les premiers décalages en choisissant d’utiliser moins de décalages avec l’argument lags :
from statsmodels.graphics import tsaplots import matplotlib.pyplot as plt #plot autocorrelation function fig = tsaplots.plot_acf(x, lags=5) plt.show()
On peut également changer le titre et la couleur des cercles utilisés dans le tracé avec les arguments titre et couleur :
from statsmodels.graphics import tsaplots import matplotlib.pyplot as plt #plot autocorrelation function fig = tsaplots.plot_acf(x, lags=5, color='g', title='Autocorrelation function') plt.show()
Vous pouvez trouver plus de didacticiels Python sur cette page .