Comment calculer l’autocorrélation en Python



L’autocorrélation mesure le degré de similarité entre une série temporelle et une version décalée d’elle-même sur des intervalles de temps successifs.

On l’appelle aussi parfois « corrélation en série » ou « corrélation décalée », car elle mesure la relation entre les valeurs actuelles d’une variable et ses valeurs historiques.

Lorsque l’autocorrélation dans une série chronologique est élevée, il devient facile de prédire les valeurs futures en se référant simplement aux valeurs passées.

Comment calculer l’autocorrélation en Python

Supposons que nous ayons la série chronologique suivante en Python qui montre la valeur d’une certaine variable pendant 15 périodes différentes :

#define data
x = [22, 24, 25, 25, 28, 29, 34, 37, 40, 44, 51, 48, 47, 50, 51]

Nous pouvons calculer l’autocorrélation pour chaque décalage de la série chronologique en utilisant la fonction acf() de la bibliothèque statsmodels :

import statsmodels.api as sm

#calculate autocorrelations
sm.tsa.acf(x)

array([ 1.        ,  0.83174224,  0.65632458,  0.49105012,  0.27863962,
        0.03102625, -0.16527446, -0.30369928, -0.40095465, -0.45823389,
       -0.45047733])

La façon d’interpréter le résultat est la suivante :

  • L’autocorrélation au décalage 0 est 1 .
  • L’autocorrélation au décalage 1 est de 0,8317 .
  • L’autocorrélation au décalage 2 est de 0,6563 .
  • L’autocorrélation au décalage 3 est de 0,4910 .

Et ainsi de suite.

On peut également spécifier le nombre de décalages à utiliser avec l’argument nlags :

sm.tsa.acf(x, nlags=5)

array([1.0, 0.83174224, 0.65632458, 0.49105012, 0.27863962, 0.03102625])

Comment tracer la fonction d’autocorrélation en Python

Nous pouvons tracer la fonction d’autocorrélation pour une série temporelle en Python en utilisant la fonction tsaplots.plot_acf() de la bibliothèque statsmodels :

from statsmodels.graphics import tsaplots
import matplotlib.pyplot as plt

#plot autocorrelation function
fig = tsaplots.plot_acf(x, lags=10)
plt.show()

Fonction d'autocorrélation en Python

L’axe des x affiche le nombre de décalages et l’axe des y affiche l’autocorrélation à ce nombre de décalages. Par défaut, le tracé commence à lag = 0 et l’autocorrélation sera toujours de 1 à lag = 0.

On peut également zoomer sur les premiers décalages en choisissant d’utiliser moins de décalages avec l’argument lags :

from statsmodels.graphics import tsaplots
import matplotlib.pyplot as plt

#plot autocorrelation function
fig = tsaplots.plot_acf(x, lags=5)
plt.show()

Tracé de la fonction d'autocorrélation en Python

On peut également changer le titre et la couleur des cercles utilisés dans le tracé avec les arguments titre et couleur :

from statsmodels.graphics import tsaplots
import matplotlib.pyplot as plt

#plot autocorrelation function
fig = tsaplots.plot_acf(x, lags=5, color='g', title='Autocorrelation function')
plt.show()

Fonction d'autocorrélation en Python avec titre personnalisé

Vous pouvez trouver plus de didacticiels Python sur cette page .

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *