Comment effectuer une jointure interne dans SAS (avec exemple)
Vous pouvez utiliser la syntaxe de base suivante pour effectuer une jointure interne avec deux ensembles de données dans SAS :
proc sql;
create table final_table as
select * from data1 as x join data2 as y
on x.ID = y.ID;
quit;
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Connexe : Comment effectuer une jointure à gauche dans SAS
Exemple : jointure interne dans SAS
Supposons que nous ayons les deux ensembles de données suivants dans SAS :
/*create datasets*/
data data1;
input team $ points;
datalines;
Mavs 99
Spurs 93
Rockets 88
Thunder 91
Warriors 104
Cavs 93
Nets 90
Hawks 91
;
run;
data data2;
input team $ rebounds;
datalines;
Mavs 21
Spurs 18
Warriors 27
Hawks 29
Knicks 40
Raptors 30
;
run;
/*view datasets*/
proc print data=data1;
proc print data=data2;
Notez que les deux ensembles de données partagent une variable en commun : team .
Nous utiliserons la syntaxe suivante pour effectuer une jointure interne et créer un nouvel ensemble de données contenant uniquement les lignes dans lesquelles la variable d’équipe apparaît dans les deux ensembles de données :
/*perform inner join*/
proc sql;
create table final_table as
select * from data1 as x join data2 as y
on x.team = y.team;
quit;
/*view results of inner join*/
proc print data=final_table;
L’ensemble de données résultant contient uniquement les lignes dans lesquelles la variable d’équipe apparaît dans les deux ensembles de données.
Si vous vous référez aux deux ensembles de données précédents, vous remarquerez qu’il n’y a que quatre équipes qui apparaissent dans les deux ensembles de données : Mavs, Spurs, Warriors et Hawks.
Puisque nous avons choisi de joindre les deux jeux de données sur la variable team , ce sont les quatre équipes qui apparaissent également dans le jeu de données final.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment normaliser les données dans SAS
Comment remplacer des caractères dans une chaîne dans SAS
Comment remplacer les valeurs manquantes par zéro dans SAS
Comment supprimer les doublons dans SAS