Comment supprimer des lignes avec des valeurs manquantes dans SAS
Vous pouvez utiliser la syntaxe de base suivante pour supprimer les lignes avec des valeurs manquantes d’un ensemble de données dans SAS :
data new_data;
set my_data;
if cmiss(of _all_) then delete;
run;
Cet exemple particulier crée un nouvel ensemble de données appelé new_data dans lequel toutes les lignes comportant des valeurs manquantes dans l’ensemble de données d’origine appelé my_data ont été supprimées.
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : Supprimer les lignes avec des valeurs manquantes dans SAS
Supposons que nous disposions de l’ensemble de données suivant dans SAS qui contient des informations sur diverses équipes de basket-ball :
/*create dataset*/
data my_data;
input team $ points assists;
datalines;
Mavs 113 22
Pacers 95 .
Cavs . .
Lakers 114 20
Heat 123 39
Kings . 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119 .
;
run;
/*view dataset*/
proc print data=my_data;
Notez qu’il existe plusieurs lignes avec des valeurs manquantes.
Nous pouvons utiliser le code suivant pour créer un nouvel ensemble de données dans lequel nous supprimons toutes les lignes de l’ensemble de données existant qui ont des valeurs manquantes dans une colonne :
/*create new dataset that removes rows with missing values from existing dataset*/
data new_data;
set my_data;
if cmiss(of _all_) then delete;
run;
/*view new dataset*/
proc print data=new_data;
Nous pouvons voir que toutes les lignes avec des valeurs manquantes ont été supprimées de l’ensemble de données.
Remarque n°1 : L’argument _all_ dans la fonction CMISS spécifie que SAS doit rechercher les valeurs manquantes dans toutes les colonnes de chaque ligne.
Note #2 : Vous pouvez retrouver la documentation complète de la fonction CMISS ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment supprimer les doublons dans SAS
Comment compter les valeurs manquantes dans SAS
Comment remplacer les valeurs manquantes par zéro dans SAS