Vous pouvez utiliser proc univarié pour calculer rapidement la moyenne, la médiane et le mode des variables dans SAS. Cette procédure utilise la syntaxe de base suivante : proc univariate data=my_data; run; L’exemple suivant montre comment utiliser cette syntaxe dans la pratique....
Vous pouvez utiliser les méthodes suivantes pour compter le nombre de valeurs manquantes dans SAS : Méthode 1 : compter les valeurs manquantes pour les variables numériques proc means data=my_data NMISS; run; Méthode 2 : compter les valeurs manquantes pour les variables de caractères...
La régression logistique est une méthode que nous pouvons utiliser pour ajuster un modèle de régression lorsque la variable de réponse est binaire. Pour évaluer dans quelle mesure un modèle de régression logistique s’adapte à un ensemble de données, nous pouvons...
Dans un vieux jeu télévisé intitulé Faisons un marché , l’animateur Monty Hall a présenté aux candidats trois portes. L’une des portes contenait un prix tandis que les deux autres n’en contenaient pas. Monty demanderait au concurrent de choisir quelle porte,...
Une boucle DO dans SAS peut être utilisée pour effectuer une action un certain nombre de fois. Il existe trois boucles DO de base dans SAS : 1. FAIRE la boucle data data1; x = 0; do i = 1 to 10;...
Vous pouvez utiliser le PREMIER. et DERNIER. fonctionne dans SAS pour identifier les première et dernière observations par groupe dans un ensemble de données SAS. Voici en résumé ce que fait chaque fonction : FIRST.variable_name attribue une valeur de 1 à la...
Vous pouvez utiliser une instruction SELECT-WHEN dans SAS pour attribuer des valeurs à une nouvelle variable en fonction des valeurs d’une variable catégorielle existante dans un ensemble de données. Cette instruction utilise la syntaxe de base suivante : data new_data; set my_data;...
Vous pouvez utiliser les méthodes suivantes pour compter le nombre de valeurs uniques par groupe dans R : Méthode 1 : utiliser Base R results <- aggregate(data=df, values_var~group_var, function(x) length(unique(x))) Méthode 2 : utiliser dplyr library(dplyr) results <- df %>% group_by(group_var) %>% summarize(count =...
Vous pouvez utiliser l’argument bins pour spécifier le nombre de bacs à utiliser dans un histogramme dans ggplot2 : library(ggplot2) ggplot(df, aes(x=x)) + geom_histogram(bins=10) Les exemples suivants montrent comment utiliser cet argument dans la pratique. Exemple : définir le nombre de compartiments pour...
Vous pouvez utiliser les méthodes suivantes pour filtrer un bloc de données par dates dans R à l’aide du package dplyr : Méthode 1 : filtrer les lignes après la date df %>% filter(date_column > '2022-01-01') Méthode 2 : filtrer les lignes avant la...