Comment calculer la moyenne d’une colonne dans R (avec exemples)
Vous pouvez utiliser l’une des méthodes suivantes pour calculer la moyenne d’une colonne dans R :
#calculate mean using column name mean(df$my_column) #calculate mean using column name (ignore missing values) mean(df$my_column, na.rm=TRUE) #calculate mean using column position mean(df[, 1]) #calculation mean of all numeric columns colMeans(df[sapply(df, is.numeric)])
Les exemples suivants montrent comment utiliser chaque méthode avec le bloc de données suivant dans R :
#create data frame df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'), points=c(99, 90, 93, 86, 88, 82), assists=c(33, 28, 31, 39, NA, 30)) #view data frame df team points assists 1 A 99 33 2 A 90 28 3 A 93 31 4 B 86 39 5 B 88 NA 6 B 82 30
Exemple 1 : calculer la moyenne à l’aide du nom de la colonne
Le code suivant montre comment calculer la moyenne de la colonne « points » à l’aide du nom de la colonne :
#calculate mean of 'points' column
mean(df$points)
[1] 89.66667
La valeur moyenne dans la colonne « points » est de 89,66667 .
Exemple 2 : calculer la moyenne à l’aide du nom de la colonne (ignorer les valeurs manquantes)
Si nous essayons de calculer la moyenne d’une colonne contenant des valeurs manquantes, nous obtiendrons NA :
#attempt to calculate mean of 'assists' column
mean(df$assists)
[1] NA
Nous devons utiliser na.rm=TRUE pour ignorer les valeurs manquantes lors du calcul de la moyenne de la colonne :
#calculate mean of 'assists' column and ignore missing values
mean(df$assists, na.rm=TRUE)
[1] 32.2
La valeur moyenne dans la colonne « passes décisives » est de 32,2 .
Exemple 3 : calculer la moyenne en utilisant la position de la colonne
Le code suivant montre comment calculer la moyenne de la colonne en position d’index 2 :
#calculate mean of column in index position 2
mean(df[, 2])
[1] 89.66667
La valeur moyenne de la colonne en position d’index 2 (la colonne « points ») est 89,66667 .
Exemple 4 : calculer la moyenne de toutes les colonnes numériques
Le code suivant montre comment calculer la moyenne de toutes les colonnes numériques du bloc de données :
#calculate mean of all numeric columns
colMeans(df[sapply(df, is.numeric)], na.rm=TRUE)
points assists
89.66667 32.20000
La sortie affiche la valeur moyenne de chaque colonne numérique du bloc de données.
Ressources additionnelles
Les tutoriels suivants expliquent comment calculer d’autres valeurs moyennes dans R :
Comment calculer une moyenne tronquée dans R
Comment calculer la moyenne géométrique dans R
Comment calculer une moyenne pondérée dans R