Comment utiliser la fonction LAG dans SAS (avec exemples)



Vous pouvez utiliser la fonction LAG dans SAS pour récupérer les valeurs décalées d’une variable.

Cette fonction utilise la syntaxe de base suivante :

lag1_value = lag(value);

Par défaut, lag trouve la valeur précédente d’une variable.

Cependant, vous pouvez utiliser lag2 , lag3 , lagn , etc. pour calculer les valeurs à 2 retards, à 3 retards, à n-décalages, etc.

Les exemples suivants montrent comment utiliser la fonction lag dans la pratique.

Exemple 1 : valeurs décalées calculées pour certaines variables

Supposons que nous ayons l’ensemble de données suivant dans SAS qui montre les ventes totales réalisées par un magasin sur des jours consécutifs :

/*create dataset*/
data original_data;
    input day $ sales;
    datalines;
1 14
2 19
3 22
4 20
5 16
6 26
7 40
8 43
9 29
10 30
11 35
12 33
;
run;

/*view dataset*/
proc print data=my_data;

Le code suivant montre comment calculer la valeur des ventes décalées de 1, 2 et 3 jours :

/*create new dataset that shows lagged values of sales*/
data new_data;
    set original_data;
    lag1_sales = lag(sales);
    lag2_sales = lag2(sales);
    lag3_sales = lag3(sales);
run;

/*view new dataset*/
proc print data=new_data;

exemple de fonction de décalage SAS

Les trois nouvelles colonnes (lag1_sales, lag2_sales, lag3_sales) affichent respectivement les ventes décalées d’un, deux et trois jours.

Exemple 2 : valeurs décalées calculées par groupe

Supposons que nous ayons l’ensemble de données suivant dans SAS qui montre les ventes totales réalisées par deux magasins au cours de jours consécutifs :

/*create dataset*/
data original_data;
    input store $ sales;
    datalines;
A 14
A 19
A 22
A 20
A 16
A 26
B 40
B 43
B 29
B 30
B 35
B 33
;
run;

/*view dataset*/
proc print data=original_data;

Nous pouvons utiliser le code suivant pour calculer les valeurs de ventes décalées sur 1 jour par magasin :

/*create new dataset that shows lagged values of sales by store*/
data new_data;
	set original_data;
	by store;
	lag1_sales = lag(sales);
	if first.store then lag1_sales = .;
run;

/*view new dataset*/
proc print data=new_data;

Décalage SAS par groupe

Les valeurs de la colonne lag1_sales affichent les valeurs de ventes décalées sur 1 jour pour chaque magasin.

Notez que la valeur de lag1_sales dans la ligne 7 est vide car la valeur décalée d’un jour pour cette ligne représente une valeur de ventes pour un autre magasin.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment normaliser les données dans SAS
Comment supprimer les doublons dans SAS
Comment remplacer les valeurs manquantes par zéro dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *