Comment calculer la corrélation glissante dans R



Les corrélations glissantes sont des corrélations entre deux séries temporelles sur une fenêtre glissante. L’un des avantages de ce type de corrélation est que vous pouvez visualiser la corrélation entre deux séries chronologiques au fil du temps.

Ce tutoriel explique comment calculer des corrélations glissantes dans R.

Comment calculer les corrélations glissantes dans R

Supposons que nous disposions du bloc de données suivant qui affiche le nombre total de produits vendus pour deux produits différents ( x et y ) sur une période de 15 mois :

#create data
data <- data.frame(month=1:15,
                   x=c(13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24, 23, 22, 20),
                   y=c(22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25, 28, 26, 28))

#view first six rows
head(data)

  month  x  y
1     1 13 22
2     2 15 24
3     3 16 23
4     4 15 27
5     5 17 26
6     6 20 26

Pour calculer une corrélation glissante dans R, nous pouvons utiliser la fonction rollapply() du package zoo .

Cette fonction utilise la syntaxe suivante :

rollapply(données, largeur, FUN, by.column=TRUE)

où:

  • data : Nom de la trame de données
  • width : Entier spécifiant la largeur de la fenêtre pour la corrélation glissante
  • FUN : La fonction à appliquer.
  • by.column : Spécifie s’il faut appliquer la fonction à chaque colonne séparément. C’est VRAI par défaut, mais pour calculer une corrélation glissante, nous devons spécifier que c’est FAUX.

Voici comment utiliser cette fonction pour calculer la corrélation glissante sur 3 mois des ventes entre le produit x et le produit y :

#calculate 3-month rolling correlation between sales for x and y
rollapply(data, width=3, function(x) cor(x[,2],x[,3]), by.column=FALSE)

 [1]  0.6546537 -0.6933752 -0.2401922 -0.8029551  0.8029551  0.9607689
 [7]  0.9819805  0.6546537  0.8824975  0.8170572 -0.9449112 -0.3273268
[13] -0.1889822

Cette fonction renvoie la corrélation entre les ventes de deux produits au cours des 3 mois précédents. Par exemple:

  • La corrélation des ventes au cours des mois 1 à 3 était de 0,6546537 .
  • La corrélation des ventes au cours des mois 2 à 4 était de -0,6933752.
  • La corrélation des ventes au cours des mois 3 à 5 était de -0,2401922.

Et ainsi de suite.

Nous pouvons facilement ajuster cette formule pour calculer la corrélation glissante pour une période de temps différente. Par exemple, le code suivant montre comment calculer la corrélation glissante sur 6 mois des ventes entre les deux produits :

#calculate 6-month rolling correlation between sales for x and y
rollapply(data, width=6, function(x) cor(x[,2],x[,3]), by.column=FALSE)

 [1] 0.5587415 0.4858553 0.6931033 0.7564756 0.8959291 0.9067715 0.7155418
 [8] 0.7173740 0.7684468 0.4541476

Cette fonction renvoie la corrélation entre les deux ventes de produits au cours des 6 mois précédents. Par exemple:

  • La corrélation des ventes au cours des mois 1 à 6 était de 0,5587415 .
  • La corrélation des ventes au cours des mois 2 à 7 était de 0,4858553.
  • La corrélation des ventes au cours des mois 3 à 8 était de 0,6931033.

Et ainsi de suite.

Remarques

Gardez les points suivants à l’esprit lorsque vous utilisez la fonction rollapply() :

  • La largeur (c’est-à-dire la fenêtre déroulante) doit être égale ou supérieure à 3 afin de calculer les corrélations.
  • Dans les formules ci-dessus, nous avons utilisé cor(x[,2],x[3]) car les deux colonnes entre lesquelles nous voulions calculer les corrélations étaient en position 2 et 3 . Ajustez ces nombres si les colonnes qui vous intéressent sont situées à des positions différentes.

Connexe : Comment calculer la corrélation glissante dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *