Souvent, vous souhaiterez peut-être combiner deux colonnes en une seule dans R. Par exemple, supposons que vous ayez un bloc de données avec trois colonnes : month year value 10 2019 15 10 2020 13 11 2020 13 11 2021 19 12...
Souvent, vous souhaiterez peut-être parcourir les noms de colonnes d’un bloc de données dans R et effectuer certaines opérations sur chaque colonne. Il existe deux manières courantes de procéder : Méthode 1 : utiliser une boucle For for (i in colnames(df)){ some operation...
Souvent, vous souhaiterez peut-être comparer deux colonnes dans R et écrire les résultats de la comparaison dans une troisième colonne. Vous pouvez facilement le faire en utilisant la syntaxe suivante : df$new_col <- ifelse(df$col1 > df$col2, 'A', ifelse(df$col1 < df$col2, 'B', 'C'))...
Souvent, vous souhaiterez peut-être calculer la moyenne de plusieurs colonnes dans R. Heureusement, vous pouvez facilement le faire en utilisant la fonction colMeans() . colMeans(df) Les exemples suivants montrent comment utiliser cette fonction dans la pratique. Utilisation de colMeans() pour trouver...
Souvent, vous souhaiterez peut-être supprimer plusieurs colonnes à la fois d’un bloc de données dans R. La manière la plus simple de procéder consiste à utiliser la syntaxe suivante : df[ , c('column_name1', 'column_name2')] <- list(NULL) Par exemple, la syntaxe suivante montre...
Souvent, vous souhaiterez peut-être calculer la moyenne par groupe dans R. Vous pouvez utiliser trois méthodes pour ce faire : Méthode 1 : utilisez la base R. aggregate(df$col_to_aggregate, list(df$col_to_group_by), FUN=mean) Méthode 2 : utilisez le package dplyr(). library(dplyr) df %>% group_by(col_to_group_by) %>% summarise_at(vars(col_to_aggregate), list(name =...
La bibliothèque de visualisation de données ggplot2 facilite la création de superbes graphiques dans R à partir de zéro. Cependant, ggplot2 ne fournit pas de titre pour les graphiques, sauf si vous en spécifiez un. Ce tutoriel explique exactement comment ajouter...
Un diagramme circulaire est un type de graphique en forme de cercle et utilise des tranches pour représenter les proportions d’un tout. Ce tutoriel explique comment créer et modifier des diagrammes circulaires dans R à l’aide de la bibliothèque de visualisation...
Le test de Shapiro-Wilk est un test de normalité. Il est utilisé pour déterminer si un échantillon provient ou non d’unedistribution normale . Ce type de test est utile pour déterminer si un ensemble de données donné provient ou non d’une...
Souvent, vous souhaiterez peut-être remplacer les valeurs manquantes dans les colonnes d’un bloc de données dans R par la moyenne ou la médiane de cette colonne particulière. Pour remplacer les valeurs manquantes dans une seule colonne, vous pouvez utiliser la syntaxe...