En statistiques, un score z nous indique à combien d’écarts types une valeur donnée se trouve par rapport à la moyenne d’une population. Nous utilisons la formule suivante pour calculer un z-score pour une valeur donnée : z = (x – μ)...
En statistiques, un score z nous indique à combien d’écarts types une valeur donnée se trouve par rapport à la moyenne d’une population. Nous utilisons la formule suivante pour calculer un z-score pour une valeur donnée : z = (x – μ)...
Une erreur que vous pouvez rencontrer dans R est : Error: Discrete value supplied to continuous scale Cette erreur se produit lorsque vous tentez d’appliquer une échelle continue à un axe dans ggplot2, alors que la variable sur cet axe n’est pas...
Vous pouvez utiliser la syntaxe de base suivante pour calculer l’écart type des colonnes dans R : #calculate standard deviation of one column sd(df$col1) #calculate standard deviation of all columns sapply(df, sd) #calculate standard deviation of specific columns sapply(df[c('col1', 'col2', 'col5')], sd)...
La fonction colMeans() dans R peut être utilisée pour calculer la moyenne de plusieurs colonnes d’une matrice ou d’un bloc de données dans R. Cette fonction utilise la syntaxe de base suivante : #calculate column means of every column colMeans(df) #calculate column...
Un test de signe est un test non paramétrique utilisé pour déterminer si une médiane de population est égale à une certaine valeur. L’exemple étape par étape suivant montre comment effectuer un test de signe dans Excel. Étape 1 : Saisissez les données...
En statistiques, les données catégorielles représentent des données qui peuvent prendre des noms ou des étiquettes. Les exemples comprennent: Statut de fumeur (« fumeur », « non-fumeur ») Couleur des yeux (« bleu », « vert », « noisette ») Niveau...
Vous pouvez utiliser la syntaxe de base suivante pour classer les variables par groupe dans dplyr : df %>% arrange(group_var, numeric_var) %>% group_by(group_var) %>% mutate(rank = rank(numeric_var)) Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le bloc de données...
Vous pouvez utiliser la syntaxe de base suivante pour additionner les colonnes en fonction de la condition dans R : #sum values in column 3 where col1 is equal to 'A' sum(df[which(df$col1=='A'), 3]) Les exemples suivants montrent comment utiliser cette syntaxe en...
En statistique, la distribution gamma est souvent utilisée pour modéliser les probabilités liées aux temps d’attente. Nous pouvons utiliser les fonctions suivantes pour travailler avec la distribution gamma dans R : dgamma(x, shape, rate) – trouve la valeur de la fonction de...