Vous pouvez utiliser la fonction tolower() intégrée dans R pour convertir les chaînes en minuscules. #convert string to lowercase tolower(string_name) Les exemples suivants montrent comment utiliser cette fonction dans la pratique. Exemple 1 : convertir une seule chaîne en minuscules Le code suivant...
La distribution normale est la distribution de probabilité la plus couramment utilisée en statistique. Il possède les propriétés suivantes : Symétrique En forme de cloche Si nous créons un tracé de la distribution normale, cela ressemblera à ceci : La distribution uniforme...
La distribution uniforme est une distribution de probabilité dans laquelle chaque valeur comprise entre un intervalle de a à b a la même probabilité de se produire. Si une variable aléatoire X suit une distribution uniforme, alors la probabilité que X...
Vous pouvez utiliser les fonctions suivantes pour arrondir les nombres dans R : round(x, digits = 0) : Arrondit les valeurs au nombre spécifié de décimales. signif(x, digits = 6) : Arrondit les valeurs au nombre spécifié de chiffres significatifs. plafond(x) : arrondit...
Vous pouvez utiliser la fonction read.delim() pour lire des fichiers texte délimités dans R. Cette fonction utilise la syntaxe de base suivante : read.delim(fichier, en-tête=TRUE, sep=’\t’) où: file : L’emplacement du fichier. header : Indique si la première ligne représente l’en-tête du...
Une estimation ponctuelle représente un nombre que nous calculons à partir de données d’échantillon pour estimer un paramètre de population. Cela constitue notre meilleure estimation possible de ce que peut être le véritable paramètre de population. Le tableau suivant montre l’estimation...
Vous pouvez utiliser la syntaxe de base suivante pour ajouter une ou plusieurs colonnes vides à un bloc de données dans R : #add one empty column called 'column1' to data frame df[ , 'column1'] <- NA #add several empty columns to...
Vous pouvez utiliser la syntaxe de base suivante pour ajouter une colonne à un bloc de données dans R en fonction des valeurs des autres colonnes : #add new column 'col3' with values based on columns 1 and 2 df$col3 <- with(df,...
La similarité cosinus est une mesure de la similarité entre deux vecteurs d’un espace produit interne. Pour deux vecteurs, A et B, la similarité cosinus est calculée comme suit : Similarité cosinus = ΣA i B i / (√ΣA i 2 √ΣB...
Il existe deux méthodes que vous pouvez utiliser pour renommer les niveaux de facteurs dans R : Méthode 1 : utiliser les niveaux() de Base R levels(df$col_name) <- c('new_name1', 'new_name2', 'new_name3') Méthode 2 : utilisez recode() du package dplyr library(dplyr) data$col_name <- recode(data$col_name, name1...