Comment calculer la moyenne d’une colonne dans R (avec exemples)



Vous pouvez utiliser l’une des méthodes suivantes pour calculer la moyenne d’une colonne dans R :

#calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na.rm=TRUE)

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is.numeric)])

Les exemples suivants montrent comment utiliser chaque méthode avec le bloc de données suivant dans R :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1    A     99      33
2    A     90      28
3    A     93      31
4    B     86      39
5    B     88      NA
6    B     82      30

Exemple 1 : calculer la moyenne à l’aide du nom de la colonne

Le code suivant montre comment calculer la moyenne de la colonne « points » à l’aide du nom de la colonne :

#calculate mean of 'points' column
mean(df$points)

[1] 89.66667

La valeur moyenne dans la colonne « points » est de 89,66667 .

Exemple 2 : calculer la moyenne à l’aide du nom de la colonne (ignorer les valeurs manquantes)

Si nous essayons de calculer la moyenne d’une colonne contenant des valeurs manquantes, nous obtiendrons NA :

#attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Nous devons utiliser na.rm=TRUE pour ignorer les valeurs manquantes lors du calcul de la moyenne de la colonne :

#calculate mean of 'assists' column and ignore missing values
mean(df$assists, na.rm=TRUE)

[1] 32.2

La valeur moyenne dans la colonne « passes décisives » est de 32,2 .

Exemple 3 : calculer la moyenne en utilisant la position de la colonne

Le code suivant montre comment calculer la moyenne de la colonne en position d’index 2 :

#calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

La valeur moyenne de la colonne en position d’index 2 (la colonne « points ») est 89,66667 .

Exemple 4 : calculer la moyenne de toutes les colonnes numériques

Le code suivant montre comment calculer la moyenne de toutes les colonnes numériques du bloc de données :

#calculate mean of all numeric columns
colMeans(df[sapply(df, is.numeric)], na.rm=TRUE)

  points  assists 
89.66667 32.20000

La sortie affiche la valeur moyenne de chaque colonne numérique du bloc de données.

Ressources additionnelles

Les tutoriels suivants expliquent comment calculer d’autres valeurs moyennes dans R :

Comment calculer une moyenne tronquée dans R
Comment calculer la moyenne géométrique dans R
Comment calculer une moyenne pondérée dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *