Un test F est utilisé pour tester si deux variances de population sont égales. Les hypothèses nulles et alternatives du test sont les suivantes : H 0 : σ 1 2 = σ 2 2 (les variances de population sont égales) H...
La régression logistique est une méthode que nous pouvons utiliser pour ajuster un modèle de régression lorsque la variable de réponse est binaire. Avant d’ajuster un modèle à un ensemble de données, la régression logistique fait les hypothèses suivantes : Hypothèse n°1...
De nombreux tests statistiques supposent que les résidus d’une variable de réponse sont normalement distribués. Cependant, les résidus ne sont souvent pas distribués normalement. Une façon de résoudre ce problème consiste à transformer la variable de réponse à l’aide de l’une...
Une transformation box-cox est une méthode couramment utilisée pour transformer un ensemble de données non normalement distribué en un ensemble plusnormalement distribué . L’idée de base derrière cette méthode est de trouver une valeur pour λ telle que les données transformées...
Une ANOVA à mesures répétées est utilisée pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes ou plus dans lesquels les mêmes sujets apparaissent dans chaque groupe. Ce didacticiel explique comment effectuer une ANOVA...
Il existe deux manières simples de modifier le titre de la légende dans un graphique ggplot2 : Méthode 1 : utiliser labs() ggplot(data, aes(x=x_var, y=y_var, fill=fill_var)) + geom_boxplot() + labs(fill='Legend Title') Méthode 2 : utilisez scale_fill_manual() ggplot(data, aes(x=x_var, y=y_var, fill=fill_var)) + geom_boxplot() + scale_fill_manual('Legend...
Vous pouvez utiliser la bibliothèque de visualisation R ggplot2 pour tracer un modèle de régression linéaire ajusté en utilisant la syntaxe de base suivante : ggplot(data,aes(x, y)) + geom_point() + geom_smooth(method='lm') L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple :...
Vous pouvez utiliser la fonction cumsum() de la base R pour calculer facilement la somme cumulée d’un vecteur de valeurs numériques. Ce didacticiel explique comment utiliser cette fonction pour calculer la somme cumulée d’un vecteur ainsi que comment visualiser une somme...
Souvent, vous souhaiterez peut-être sélectionner la première ligne de chaque groupe à l’aide du package dplyr dans R. Vous pouvez utiliser la syntaxe de base suivante pour ce faire : df %>% group_by(group_var) %>% arrange(values_var) %>% filter(row_number()==1) L’exemple suivant montre comment utiliser...