Vous pouvez utiliser la syntaxe de base suivante pour appliquer une fonction lambda à un DataFrame pandas : df['col'] = df['col'].apply(lambda x: 'value1' if x < 20 else 'value2') Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le DataFrame...
Lorsqu’il s’agit de sélectionner des lignes et des colonnes d’un DataFrame pandas, .loc et .at sont deux fonctions couramment utilisées. Voici la subtile différence entre les deux fonctions : .loc peut prendre plusieurs lignes et colonnes comme arguments d’entrée .at ne...
Vous pouvez utiliser la fonction NumPy Where() pour mettre à jour rapidement les valeurs d’un tableau NumPy à l’aide de la logique if-else. Par exemple, le code suivant montre comment mettre à jour les valeurs d’un tableau NumPy qui remplissent une...
Souvent, vous souhaiterez peut-être ajouter des sous-totaux à un tableau croisé dynamique pandas. Heureusement, cela est facile à faire en utilisant les fonctions intégrées aux pandas. L’exemple suivant montre comment procéder. Exemple : ajouter des sous-totaux au tableau croisé dynamique Pandas Supposons...
Vous pouvez utiliser la syntaxe de base suivante pour créer un tableau croisé dynamique dans pandas qui affiche la somme des valeurs dans certaines colonnes : pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum') L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple :...
Une erreur que vous pouvez rencontrer lors de l’utilisation de pandas est : ValueError: Cannot mask with non-boolean array containing NA / NaN values Cette erreur se produit généralement lorsque vous essayez de trouver les lignes d’un DataFrame pandas qui contiennent une...
Une erreur que vous pouvez rencontrer dans R est : Error: `data` must be a data frame, or other object coercible by `fortify()`, not a numeric vector Cette erreur se produit lorsque vous tentez d’utiliser ggplot2 pour tracer des variables dans un...
Vous pouvez utiliser la syntaxe de base suivante pour remplacer plusieurs valeurs dans un bloc de données dans R à l’aide des fonctions du package dplyr : library(dplyr) df %>% mutate(var1 = recode(var1, 'oldvalue1' = 'newvalue1', 'oldvalue2' = 'newvalue2'), var2 = recode(var2,...
Vous pouvez utiliser les méthodes suivantes pour remplacer une chaîne dans une colonne spécifique d’un bloc de données à l’aide des fonctions du package dplyr : Méthode 1 : remplacer une chaîne par une nouvelle chaîne library(dplyr) library(stringr) df %>% mutate(across('column_name', str_replace, 'old_value',...
Vous pouvez utiliser la fonction across() du package dplyr dans R pour appliquer une transformation à plusieurs colonnes. Il existe d’innombrables façons d’utiliser cette fonction, mais les méthodes suivantes illustrent quelques utilisations courantes : Méthode 1 : appliquer une fonction à plusieurs colonnes...