Vous pouvez utiliser les méthodes suivantes pour compter le nombre de valeurs NA dans chaque colonne d’un bloc de données dans R : Méthode 1 : compter les valeurs NA dans chaque colonne en utilisant la base R sapply(df, function(x) sum(is.na(x))) Méthode...
Vous pouvez utiliser les méthodes suivantes pour réduire le texte par groupe dans un bloc de données dans R : Méthode 1 : Réduire le texte par groupe à l’aide de Base R aggregate(text_var ~ group_var, data=df, FUN=paste, collapse='') Méthode 2 : Réduire...
Vous pouvez utiliser les méthodes suivantes pour extraire des nombres à partir de chaînes dans R : Méthode 1 : extraire le numéro de la chaîne à l’aide de la base R as.numeric(gsub("\\D", "", df$my_column)) Méthode 2 : extraire le numéro de la chaîne...
Vous pouvez utiliser les méthodes suivantes pour sous-définir un bloc de données selon plusieurs conditions dans R : Méthode 1 : trame de données de sous-ensemble utilisant la logique « OU » df_sub <- subset(df, team == 'A' | points < 20) Cet exemple particulier...
Vous pouvez utiliser la syntaxe de base suivante pour ajouter un nouveau niveau à une variable de facteur dans R : levels(df$my_factor) <- c(levels(df$my_factor), 'new_level') L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : ajouter un nouveau niveau au facteur...
Vous pouvez utiliser la macro suivante dans SAS pour vérifier rapidement si un ensemble de données existe : %macro check_exists(data); %if %sysfunc(exist(&data.)) %then %do; %put Dataset Exists; %end; %else %do; %put Dataset Does Not Exist; %end; %mend check_exists; Lorsque vous exécutez cette...
Vous pouvez utiliser la syntaxe de base suivante pour calculer les quartiles d’un ensemble de données dans SAS : /*calculate quartile values for variable called var1*/ proc univariate data=original_data; var var1; output out=quartile_data pctlpts = 25 50 75 pctlpre = Q_; run;...
En statistiques, les déciles sont des nombres qui divisent un ensemble de données en dix groupes de fréquence égale. Le premier décile est le point où 10 % de toutes les valeurs des données se situent en dessous. Le deuxième décile...
Vous pouvez utiliser la syntaxe de base suivante pour inclure plusieurs ensembles de données dans l’instruction set dans SAS : data new_data; set data1 data2 data3; run; L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : utiliser l’instruction SET avec...
Vous pouvez utiliser la syntaxe suivante pour convertir une colonne de date dans un DataFrame pandas au format AAAAMMJJ : #convert date column to datetime df['date_column'] = pd.to_datetime(df['date_column']) #convert date to YYYYMMDD format df['date_column'] = df['date_column'].dt.strftime('%Y%m%d').astype(int) L’exemple suivant montre comment utiliser cette...