« Réduire la tendance » des données de séries chronologiques signifie supprimer une tendance sous-jacente dans les données. La principale raison pour laquelle nous souhaitons procéder ainsi est de visualiser plus facilement les sous-tendances des données qui sont saisonnières ou cycliques. Par exemple,...
Nous pouvons utiliser la syntaxe suivante pour tracer une droite de régression par groupe à l’aide du package de visualisation R ggplot2 : ggplot(df, aes(x = x_variable, y = y_variable, color = group_variable)) + geom_point() + geom_smooth(method = "lm", fill =...
L’une des principales hypothèses de la régression linéaire est qu’il n’y a pas de corrélation entre les résidus consécutifs. En d’autres termes, on suppose que les résidus sont indépendants. Lorsque cette hypothèse n’est pas respectée, les erreurs types des coefficients dans...
En statistiques, la variance groupée fait simplement référence à la moyenne de deux ou plusieurs variances de groupe. Nous utilisons le mot « regroupé » pour indiquer que nous « regroupons » deux ou plusieurs variances de groupe pour obtenir un nombre unique pour la...
Winsoriser les données signifie définir des valeurs aberrantes extrêmes égales à un centile spécifié des données. Par exemple, une winsorisation de 90 % définit toutes les observations supérieures au 95e centile égales à la valeur au 95e centile et toutes les...
Winsoriser les données signifie définir des valeurs aberrantes extrêmes égales à un centile spécifié des données. Par exemple, une winsorisation de 90 % définit toutes les observations supérieures au 95e centile égales à la valeur au 95e centile et toutes les...
Un tracé de points empilés est un type de tracé qui affiche les fréquences à l’aide de points. Il existe deux méthodes que vous pouvez utiliser pour créer un tracé de points empilés dans R : Méthode 1 : La fonction stripchart()...
Centrer un ensemble de données signifie soustraire la valeur moyenne de chaque observation individuelle dans l’ensemble de données. Par exemple, supposons que nous ayons l’ensemble de données suivant : Il s’avère que la valeur moyenne est de 14. Ainsi, pour centrer cet...
Nous pouvons utiliser la syntaxe suivante pour additionner des lignes spécifiques d’un bloc de données dans R : with(df, sum(column_1[column_2 == 'some value'])) Cette syntaxe trouve la somme des lignes de la colonne 1 dans laquelle la colonne 2 est égale à...
La fonction ifelse() en base R peut être utilisée pour écrire des instructions if-else rapides. Cette fonction utilise la syntaxe suivante : ifelse(tester, oui, non) où: test : un test logique yes : La valeur à retourner si le test logique est True...