Comment calculer une moyenne mobile exponentielle dans R
Dans l’analyse des séries chronologiques, une moyenne mobile est simplement la valeur moyenne d’un certain nombre de périodes précédentes.
Une moyenne mobile exponentielle est un type de moyenne mobile qui accorde plus de poids aux observations récentes, ce qui signifie qu’elle est capable de capturer plus rapidement les tendances récentes.
Ce tutoriel explique comment calculer une moyenne mobile exponentielle dans R.
Exemple : moyenne mobile exponentielle dans R
Supposons que nous ayons le bloc de données suivant dans R :
#create data frame df <- data.frame(period=1:10, sales=c(25, 20, 14, 16, 27, 20, 12, 15, 14, 19)) #view data frame df period sales 1 1 25 2 2 20 3 3 14 4 4 16 5 5 27 6 6 20 7 7 12 8 8 15 9 9 14 10 10 19
Nous pouvons utiliser la fonction movavg() du package pracma pour calculer la moyenne mobile pondérée exponentiellement pour un certain nombre de périodes précédentes.
Cette fonction utilise la syntaxe suivante :
movavg(x, n, type=c(« s », « t », « w », « m », « e », « r »))
où:
- x : série chronologique sous forme de vecteur numérique
- n : Nombre de périodes précédentes à utiliser pour la moyenne
- type : Type de moyenne mobile à calculer. Nous utiliserons « e » pour moyenne mobile pondérée exponentielle.
Par exemple, voici comment calculer la moyenne mobile pondérée exponentiellement en utilisant les quatre périodes précédentes :
library(pracma) #create new column to hold 4-day exponentially weighted moving average df$EWM_4day <- movavg(df$sales, n=4, type='e') #view DataFrame df period sales 4dayEWM 0 1 25 25.000000 1 2 20 23.000000 2 3 14 19.400000 3 4 16 18.040000 4 5 27 21.624000 5 6 20 20.974400 6 7 12 17.384640 7 8 15 16.430784 8 9 14 15.458470 9 10 19 16.875082
Nous pouvons également utiliser la bibliothèque de visualisation ggplot2 pour visualiser les ventes par rapport à la moyenne mobile pondérée exponentiellement sur 4 jours :
library(ggplot2)
library(reshape2)
#melt data into format for easy plotting
df <- melt(df , id.vars = 'period', variable.name = 'series')
#plot sales vs. 4-day exponentially weighted moving average
ggplot(df, aes(period, value)) +
geom_line(aes(colour = series))
La ligne rouge affiche les ventes au cours de chaque période et la ligne bleue affiche la moyenne mobile pondérée exponentiellement.
Ressources additionnelles
Comment tracer plusieurs colonnes dans R
Comment faire la moyenne sur les colonnes dans R
Comment calculer la moyenne par groupe dans R