Comment utiliser la fonction colMeans() dans R



La fonction colMeans() dans R peut être utilisée pour calculer la moyenne de plusieurs colonnes d’une matrice ou d’un bloc de données dans R.

Cette fonction utilise la syntaxe de base suivante :

#calculate column means of every column
colMeans(df)

#calculate column means and exclude NA values
colMeans(df, na.rm=T)

#calculate column means of specific columns
colMeans(df[c('col1', 'col3', 'col4')])

Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.

Exemple 1 : calculer la moyenne de chaque colonne

Le code suivant montre comment calculer la moyenne de chaque colonne d’un bloc de données :

#create data frame
df <- data.frame(points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df)

  points  assists rebounds   blocks 
    91.8     33.0     26.8      3.6 

Exemple 2 : Calculer la moyenne de chaque colonne et exclure les NA

Le code suivant montre comment calculer la moyenne de chaque colonne et exclure les valeurs NA :

#create data frame with some NA values
df <- data.frame(points=c(99, 91, 86, 88, 95),
                 assists=c(33, NA, 31, 39, 34),
                 rebounds=c(30, 28, NA, NA, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df, na.rm=T)

  points  assists rebounds   blocks 
91.80000 34.25000 28.66667  3.60000

Exemple 3 : calculer la moyenne de colonnes spécifiques

Le code suivant montre comment calculer les valeurs moyennes de colonnes spécifiques dans le bloc de données :

#create data frame
df <- data.frame(points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for 'points' and 'blocks' columns
colMeans(df[c('points', 'blocks')])

points blocks 
  91.8    3.6 

Notez que nous pouvons également utiliser des valeurs d’index pour calculer la moyenne de colonnes spécifiques :

#create data frame
df <- data.frame(points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for columns in position 1 and 4
colMeans(df[c(1, 4)])

points blocks 
  91.8    3.6 

Ressources additionnelles

Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes dans R :

Comment calculer l’écart type des colonnes dans R
Comment calculer la moyenne par groupe dans R
Comment calculer la somme par groupe dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *