Comment parcourir les noms de colonnes dans R (avec exemples)



Souvent, vous souhaiterez peut-être parcourir les noms de colonnes d’un bloc de données dans R et effectuer certaines opérations sur chaque colonne. Il existe deux manières courantes de procéder :

Méthode 1 : utiliser une boucle For

for (i in colnames(df)){
   some operation
}

Méthode 2 : utilisez sapply()

sapply(df, some operation)

Ce didacticiel montre un exemple d’utilisation pratique de chacune de ces méthodes.

Méthode 1 : utiliser une boucle For

Le code suivant montre comment parcourir les noms de colonnes d’un bloc de données à l’aide d’une boucle for et afficher la valeur moyenne de chaque colonne :

#create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1    1    7    3    1
2    3    7    3    1
3    3    8    6    2
4    4    3    6    8
5    5    2    8    9

#loop through each column and print mean of column
for (i in colnames(df)){
    print(mean(df[[i]]))
}

[1] 3.2
[1] 5.4
[1] 5.2
[1] 4.2

Méthode 2 : utilisez sapply()

Le code suivant montre comment parcourir les noms de colonnes d’un bloc de données à l’aide de sapply() et afficher la valeur moyenne de chaque colonne :

#create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1    1    7    3    1
2    3    7    3    1
3    3    8    6    2
4    4    3    6    8
5    5    2    8    9

#loop through each column and print mean of column
sapply(df, mean)

var1 var2 var3 var4 
 3.2  5.4  5.2  4.2 

Notez que les deux méthodes renvoient des résultats identiques.

Connexe : Un guide pour apply(), lapply(), sapply() et tapply() dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *