Souvent, en statistiques, les ensembles de données avec lesquels nous travaillons incluent des variables catégorielles . Ce sont des variables qui prennent des noms ou des étiquettes. Les exemples comprennent: État civil (« marié », « célibataire », « divorcé »)...
Vous pouvez utiliser la syntaxe suivante pour augmenter la taille d’un seul tracé dans Matplotlib : import matplotlib.pyplot as plt #define figure size in (width, height) for a single plot plt.figure(figsize=(3,3)) Et vous pouvez utiliser la syntaxe suivante pour augmenter la taille...
Vous pouvez utiliser la fonction pandas.DataFrame.idxmax() pour renvoyer l’index de la valeur maximale sur un axe spécifié dans un DataFrame pandas. Cette fonction utilise la syntaxe suivante : DataFrame.idxmax(axis=0, skipna=True) où: axis : L’axe à utiliser (0 = lignes, 1 = colonnes)....
Vous pouvez utiliser la syntaxe suivante pour sélectionner des lignes uniques dans un DataFrame pandas : df = df.drop_duplicates() Et vous pouvez utiliser la syntaxe suivante pour sélectionner des lignes uniques dans des colonnes spécifiques dans un DataFrame pandas : df = df.drop_duplicates(subset=['col1',...
Vous pouvez utiliser la syntaxe suivante pour exporter un DataFrame pandas vers un fichier CSV : df.to_csv(r'C:\Users\Bob\Desktop\my_data.csv', index=False) Notez que index=False indique à Python de supprimer la colonne d’index lors de l’exportation du DataFrame. N’hésitez pas à supprimer cet argument si vous...
Vous pouvez utiliser la fonction replace_na() du package Tidyr pour remplacer les NA par des chaînes spécifiques dans une colonne d’un bloc de données dans R : #replace NA values in column x with "missing" df$x %>% replace_na('none') Vous pouvez également utiliser...
La fonction str_split() du package stringr dans R peut être utilisée pour diviser une chaîne en plusieurs morceaux. Cette fonction utilise la syntaxe suivante : str_split(chaîne, motif) où: chaîne : vecteur de caractères motif : motif sur lequel diviser De même, la fonction str_split_fixed() du...
Vous pouvez utiliser la fonction write.table dans R pour exporter un bloc de données ou une matrice vers un fichier. Cette fonction utilise la syntaxe de base suivante : write.table(df, file='C:\\Users\\bob\\Desktop\\data.txt') Par défaut, les valeurs du fichier exporté sont séparées par un...
Vous pouvez utiliser la syntaxe suivante pour supprimer une légende d’un tracé dans ggplot2 : ggplot(df, aes(x=x, y=y, color=z)) + geom_point() + theme(legend.position="none") En spécifiant legend.position=”none” vous dites à ggplot2 de supprimer toutes les légendes du tracé. L’exemple suivant étape par étape...
Vous pouvez utiliser la syntaxe suivante pour faire pivoter les étiquettes des axes dans un tracé ggplot2 : p + theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1)) L’ angle contrôle l’angle du texte tandis que vjust et hjust contrôlent la...