La fonction lapply() dans R peut être utilisée pour appliquer une fonction à chaque élément d’une liste, d’un vecteur ou d’un bloc de données et obtenir une liste en conséquence. Pour utiliser la fonction lapply() avec plusieurs arguments, vous pouvez utiliser...
Vous pouvez utiliser la syntaxe de base suivante avec la fonction grepl() dans R pour filtrer les lignes d’un bloc de données contenant l’un des nombreux modèles de chaîne dans une colonne spécifique : library(dplyr) new_df <- filter(df, grepl(paste(my_patterns, collapse='|'), my_column)) Cette...
Vous pouvez utiliser les méthodes suivantes pour mettre à l’échelle les valeurs d’une variable entre 0 et 1 dans R : Méthode 1 : utiliser la base R #define function to scale values between 0 and 1 scale_values <- function(x){(x-min(x))/(max(x)-min(x))} x_scaled <- rescale(x)...
Vous pouvez utiliser les méthodes suivantes pour utiliser la fonction which() avec plusieurs conditions dans R : Méthode 1 : which() avec plusieurs conditions utilisant AND new_df <- df[which(df$my_column >= 14 & df$my_column <= 25), ] Méthode 2 : which() avec plusieurs conditions utilisant...
Vous pouvez utiliser la fonction pandas.to_datetime() pour convertir une colonne de chaîne en colonne datetime dans un DataFrame pandas. Lorsque vous utilisez cette fonction, vous pouvez utiliser l’argument format pour spécifier le format dans lequel se trouve votre date afin d’éviter...
Vous pouvez définir la fonction personnalisée suivante pour rechercher des valeurs uniques dans les pandas et ignorer les valeurs NaN : def unique_no_nan(x): return x.dropna().unique() Cette fonction renverra une série pandas qui contient chaque valeur unique à l’exception des valeurs NaN. Les...
Le coefficient de corrélation de Pearson peut être utilisé pour mesurer l’association linéaire entre deux variables. Ce coefficient de corrélation prend toujours une valeur comprise entre -1 et 1 où : -1 : Corrélation linéaire parfaitement négative entre deux variables. 0...
Vous pouvez utiliser l’argument marqueur avec la valeur o pour créer un tracé marin avec des points comme marqueurs : import seaborn as sns sns.lineplot(data=df, x='x_var', y='y_var', marker='o') L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : créer un tracé...
Vous pouvez utiliser la syntaxe de base suivante pour compter le nombre d’éléments égal à zéro dans un tableau NumPy : import numpy as np np.count_nonzero(my_array==0) Cet exemple particulier renverra le nombre d’éléments égal à zéro dans le tableau NumPy appelé my_array...
Vous pouvez utiliser la syntaxe de base suivante pour compter le nombre d’éléments égaux à True dans un tableau NumPy : import numpy as np np.count_nonzero(my_array) Cet exemple particulier renverra le nombre d’éléments égal à True dans le tableau NumPy appelé my_array...