Vous pouvez utiliser la fonction cor() dans R pour calculer les coefficients de corrélation entre les variables. Voici les manières les plus courantes d’utiliser cette fonction : Méthode 1 : calculer le coefficient de corrélation de Pearson entre deux variables cor(df$x, df$y) Utilisez le...
La fonction sub() dans R peut être utilisée pour remplacer la première occurrence de certains textes dans une chaîne dans R. Cette fonction utilise la syntaxe de base suivante : sub(pattern, replacement, x) où: pattern : Le modèle à rechercher remplacement :...
Vous pouvez utiliser les méthodes suivantes pour compter les doublons dans un bloc de données dans R : Méthode 1 : compter les valeurs en double dans une colonne sum(duplicated(df$my_column)) Méthode 2 : compter les lignes en double nrow(df[duplicated(df), ]) Méthode 3 : compter les...
Vous pouvez utiliser l’opérateur CONTAINS dans l’instruction SQL PROC dans SAS pour renvoyer uniquement les lignes dans lesquelles une variable d’un ensemble de données contient un modèle de chaîne. Les exemples suivants montrent comment utiliser l’opérateur CONTAINS en pratique avec l’ensemble...
Bien qu’il ne soit pas possible d’utiliser une instruction IF dans PROC SQL dans SAS, vous pouvez utiliser l’opérateur CASE pour définir les valeurs qu’une variable doit prendre en fonction de certaines conditions. Les exemples suivants montrent comment utiliser l’opérateur CASE...
Vous pouvez utiliser une instruction IF-THEN-ELSE dans SAS pour renvoyer une valeur si une condition est vraie, sinon renvoyer une autre valeur si une condition n’est pas vraie. Cette instruction utilise la syntaxe de base suivante : if var1 > 30 then...
Vous pouvez utiliser proc report dans SAS pour générer un rapport pour un ensemble de données dans SAS avec le formatage exact que vous souhaitez. Cette procédure utilise la syntaxe de base suivante : /*create report*/ proc report data=my_data; run; Cela générera...
Vous pouvez utiliser la fonction INTNX dans SAS pour incrémenter une date d’un intervalle spécifique tel qu’un jour, une semaine, un mois, etc. Cette fonction utilise la syntaxe de base suivante : INTNX (intervalle, date_début, incrément) où: interval : L’intervalle à ajouter...
Vous pouvez utiliser l’argument alpha dans la fonction geom_point() dans ggplot2 pour modifier la transparence des points d’un tracé. Cet argument utilise la syntaxe de base suivante : ggplot(df, aes(x=x, y=y)) + geom_point(alpha=1) La valeur de alpha peut être comprise entre 0...
Vous pouvez utiliser la syntaxe de base suivante pour créer un histogramme par groupe dans ggplot2 : ggplot(df, aes(x=values_var, fill=group_var)) + geom_histogram(color='black', alpha=0.4, position='identity') + scale_fill_manual(values=c('red', 'blue', 'purple')) Cet exemple particulier crée un tracé avec trois histogrammes superposés rouge, bleu et violet....